ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE. Klasifikace s apriorní znalostí

Rozměr: px
Začít zobrazení ze stránky:

Download "ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE. Klasifikace s apriorní znalostí"

Transkript

1 ZADÁNÍ 1

2 ZADÁNÍ 2

3 ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Katedra počítačů Bakalářská práce Klasifikace s apriorní znalostí červen 2007 Vypracoval: Michal Trna Vedoucí práce: Ing. Jiří Kléma, PhD. 3

4 BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE 4

5 Poděkování Chtěl bych na tomto místě poděkovat všem, kteří mi jakýkoli způsobem pomáhali při vzniku této práce. Zvláště děkuji vedoucímu mé bakalářské práce Ing. Jiřímu Klémovi, PhD. za odbornou pomoc a svému počítači za stovky hodin procesorového času. 5

6 BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE 6

7 Čestné prohlášení Prohlašuji, že jsem zadanou bakalářskou práci vypracoval samostatně s přispěním vedoucího práce a použil jsem pouze podklady uvedené v přiloženém seznamu. Dále prohlašuji, že nemám závažný důvod proti užití tohoto díla ve smyslu 60 Zákona č. 121/2000 Sb., o právu autorském, o právech souvisejících s právem autorským a o změně některých zákonů (autorský zákon). V Praze dne podpis 7

8 BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE 8

9 ABSTRAKT Oblast analýzy biomedicínských dat je poměrně mladá disciplína a v současnosti se velmi rychle rozvíjí. Problémy zpracování těchto specifických dat vybízí k vyvinutí nových efektivních metod, k čemuž má přispět i tato práce; zabýváme se v ní implementací a vyhodnocením výsledků modifikovaného klasifikátoru CN2. Nově dodaným prvkem v něm je zvažování použití apriorní znalosti získané z popisů atributů, v našem případě genů. Různé přístupy použití této znalosti při stavbě klasifikačních pravidel zde pak rozebíráme a vyhodnocujeme. ABSTRACT The analysis of biomedical data is quite young and rapidly developing discipline at present. Problems of processing such specific data provokes us to develop new effective methods, whereto this work should contribute. It inquires into the implementation and evaluation of results of the modified algorithm CN2. The newly added aspect to this algorithm is consideration of usage of the knowledge extracted from annotations of attributes, in our case genes. Various approaches of usage of this knowledge in the building process of classification rules are analysed and interpreted. 9

10 BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE 10

11 Obsah Obsah 11 Seznam obrázků 13 Seznam grafů 14 Seznam tabulek 15 1 Úvod Úvod do genetiky DNA Geny Chromozomy Genomická data Sekvenování DNA Genové čipy Genomická data SAGE data AML ALL data Genové ontologie Klasifikace CN Křížová validace 37 2 Injekce apriorní znalosti Získání termínů z genových popisů Získání matice podobnosti Úpravy v CN

12 3 Experimenty 45 4 Závěr 53 A. Seznam zkratek 54 B. Reference 55 C. Příloha 57 I. Obsah přiloženého média 57 II. Popis částí zdrojového kódu 58 III.Popis instalace a spouštění CN2 61 IV.Popisy přiložených skriptů 62 12

13 Seznam obrázků Obr. 1. Struktura DNA 20 Obr. 2. Proces přepisu genetické informace do proteinů 23 Obr. 3. Proces hybridizace na genovém čipu 27 Obr. 4 Paprskové procházení stavovým prostorem algoritmu CN

14 Seznam grafů Graf 1. Kl. přesnost CN2 s bg. knowledge z GO BP injektovanou do primusu 45 Graf 2. Kl. přesnost CN2 s bg. knowledge z GO MF injektovanou do primusu 46 Graf 3. Kl. přesnost CN2 s bg. knowledge z GO BP injektovanou do primusu 47 Graf 4. Kl. přesnost CN2 s bg. knowledge z GO MF injektovanou do primusu 47 Graf 5. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do primusu 48 Graf 6. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do primusu 48 Graf 7. Kl. přesnost CN2 s bg. knowledge z GO BP/MF injektovanou do secundusu 49 Graf 8. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do secundusu 50 Graf 9. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do secundusu 50 Graf 10. Kl. přesnost CN2 s feature selection 51 14

15 Seznam tabulek Tab. 0. Významy kodónů krátká označení aminokyselin a příslušné kodóny 20 Tab. 1. Kl. přesnost CN2 s bg. knowledge z GO BP injektovanou do primusu 45 Tab. 2. Kl. přesnost CN2 s bg. knowledge z GO MF injektovanou do primusu 46 Tab. 3. Kl. přesnost CN2 s bg. knowledge z GO BP injektovanou do primusu 47 Graf 4. Kl. přesnost CN2 s bg. knowledge z GO MF injektovanou do primusu 47 Tab. 5. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do primusu 48 Tab. 6. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do primusu 48 Tab. 7. Kl. přesnost CN2 s bg. knowledge z GO BP/MF injektovanou do secundusu 49 Tab. 8. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do secundusu 50 Tab. 9. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do secundusu 50 15

16 BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE 16

17 1. Úvod Informační společnost generuje a kumuluje ohromná množství dat, která ve své surové podobě nezřídka nesou jenom malou pragmatickou informaci. K jejich zpracování do zužitkovatelné podoby byly v průběhu let vyvinuty netriviální přístupy, které byly souhrnně začleněny pod hlavičku dolování dat (data mining, DM) popř. objevování dat v databázích (knowledge discovery in databases, KDD). Mezi základní úlohy disciplíny patří vyhledávání netriviálních vzorů, souvislostí či pravidel v datech a jejich přehledné, člověkem pochopitelné prezentování. Tato bakalářská práce se zabývá úpravou klasifikačního algoritmu CN2 pro účely vylepšení jeho predikční přesnosti pro data, u kterých máme tzv. apriorní znalost (background knowledge), tj. předem danou znalost vztahující se k jednotlivým atributům. Touto znalostí může být jako v našem případě například textový popis genu, na jehož základu se dá usuzovat na souvztažnost některých atributů, a na základě této doplňkové znalosti můžeme výběry příslušných atributů do generovaných pravidel motivovat. Od tohoto přístupu si slibujeme vylepšené klasifikační schopnosti nového algoritmu Úvod do genetiky V této části se stručně zmíním o původu dat, nad kterými byly prováděny experimenty. Nejprve bychom si měli vytvořit představu o tom, co to genetická data vlastně jsou: jsou to data týkající se obecně genomu; v našem kontextu jde vždy o data týkající se genomu lidského, takže všechna následující tvrzení o genomu budiž 17

18 chápana v kontextu lidského genomu. Nejjednodušší ještě výstižná představa o genomu by mohla vypadat takto: genom je úplný sada instrukcí kódujících elementární procesy uvnitř lidského těla (včetně jeho vzniku a také regulace procesu vzniku). Obsahuje plány (návrh, design) základního tělesného uspořádání, všech buněčných struktur a nitro buněčných procesů včetně životního cyklu. Lidský genom je zakódovaný v molekulách deoxyribonukleové kyseliny (DNA), které se standardně nacházejí v jádře prakticky všech buněk (kromě bezjaderných červených krvinek), kde spočívají těsně stočené ve šroubovici; spolu s připojenými proteinovými molekulami tvoří organizační jednotku zvanou chromozom. Chromozomů má člověk v každé běžné buňce 46. V následujících odstavcích se stručně zmíním o základním popise a funkci DNA DNA Po chemické stránce je DNA dlouhý polymer skládající se z jednoduchých informaci nesoucích jednotek zvaných nukleotidy navázaných na informaci nenesoucí kostře z cukrů a fosfátů (zbytky po kyselině fosforečné). Ke každému cukru je připojena jedna ze čtyř druhů molekul zvaných báze; těmito bázemi mohou být adenin (A), cytosin (C), guanin (G) a thymin (T). Sekvence těchto bází podél fosfátové kostry molekuly kóduje informaci podobně jako ji kódují dipóly na magnetické pásce. Molekula DNA obsahuje dvě taková vlákna, která jsou k sobě připojena bázemi. Báze se na sebe vážou pomocí vodíkových můstků; vždy adenin s thyminem a cytosin s guaninem; říká se, že jsou tyto báze navzájem komplementární. Tyto báze spolu s cukr fosfátovou kostrou tvoří dvojitou šroubovici (double helix). Přesné pořadí bází 18

19 podél kostry se nazývá DNA sekvence. Tato sekvence přesně obsahuje instrukce pro vznik organizmu se specifickými rysy a též pro všechny jeho vnitřní pochody. Velikost genomu se obvykle vyjadřuje jako počet bázových dvojic. Pro lidský genom se toto číslo pohybuje přibližně na 2, dvojicích, pro srovnání pro genom domácí myši je to asi 2, dvojic, pro rýži asi 0, dvojic. Trojce po sobě následujících bází tvoří tzv. kodón. Vzhledem k tomu, že máme 4 možné báze, máme 4 3 = 64 možných kodónů, označují se postupným zápisem písmen označujících jednotlivé báze (např. AAC, AUG). Tyto kodóny jsou úzce spjaty s tzv. aminokyselinami, do kterých se při procesu předávání informace z DNA (translace) přepisují; těchto aminokyselin máme 20. Některé kodóny mají speciální synchronizační funkci, např. start a stop kodóny vymezující oblast translace (viz dále). Ala A GCU, GCC, GCA, GCG Leu L UUA, UUG, CUU, CUC, CUA, CUG Arg R CGU, CGC, CGA, CGG, AGA, Lys K AAA, AAG AGG Asn N AAU, AAC Met M AUG Asp D GAU, GAC Phe F UUU, UUC Cys C UGU, UGC Pro P CCU, CCC, CCA, CCG Gln Q CAA, CAG Ser S UCU, UCC, UCA, UCG, AGU, AGC Glu E GAA, GAG Thr T ACU, ACC, ACA, ACG Gly G GGU, GGC, GGA, GGG Trp W UGG His H CAU, CAC Tyr Y UAU, UAC Ile I AUU, AUC, AUA Val V GUU, GUC, GUA, GUG Start AUG, GUG Stop UAG, UGA, UAA Tab. 0 Významy kodónů krátká označení aminokyselin a příslušné kodóny 19

20 Z předchozí tabulky (tab. 0) je vidět, že genetický kód je tzv. redundantní či degenerovaný tj. že jedna aminokyselina odpovídá většímu množství kodónů. Z tohoto důvodu není možné z vyrobeného aminokyselinového řetězce zjistit původní podobu genu. Jak již bylo řečeno, DNA je nukleová kyselina, vyskytující se s výjimkou bezjaderných červených krvinek v jádře, která obsahuje genetické instrukce používané při vývoji organismu a při řízení jeho vnitřních procesů. Hlavním úkolem DNA je dlouhodobé uložení této informace. Segmenty DNA, které nesou smysluplnou genetickou informaci se nazývají geny; sem patří i části DNA nesoucí informaci o struktuře nebo mají regulační účel. Na DNA jsou taktéž hluché úseky bez jakéhokoliv známého významu, tzv. junk DNA, která tvoří až 97% lidské DNA. Obr. 1 Struktura DNA 20

21 Obrázek na předchozí straně (obr. 1) jasně zachycuje strukturu DNA: po stranách se ve vertikálním smyslu vine cukr fosfátové vlákno; vprostřed jsou na sebe navázané A T a C G báze. Všimněte si, že báze adenin a thymin jsou navázány pomocí dvou můstků, zatímco cytosin s thyminem váží tři můstky a tedy jsou bezpečně nezaměnitelné. V RNA se místo thyminu používá trojvazný uracil (U). Jak již bylo zmíněno, základní jednotkou genetické informace je gen, který je schopný (resp. podstupuje; podle úhlu pohledu) množení (reprodukce) a změny (mutace). Funkcí je realizace nějakého znaku či vlastnosti, kterou kóduje. V makroskopickém pohledu je sám o sobě víceméně pouze kus informace, která podléhá výběrovým (selektivním; či vývojovým evolučním) tlakům. Není bez zajímavosti, že tzv. emergentní jevy nad pooly různých genů nacházejí uplatnění v jiných části umělé inteligence než kterou se zde zabýváme v genetickém programování, návrhu genetických algoritmů a výzkumu kolektivní inteligence. Dnes víme, že lidský genom obsahuje ne více než genů [1], v době psaná této práce známe s tím, že ještě asi 100 čeká na objevení [2]. Z tohoto lze vypozorovat, že genová hustota, která udává počet genů na bázi (b; popř. mega bázi Mb), je poměrně nízká. Hustota lidského genomu je asi genů na Mb [3]. Prokaryota mají tuto hustotu vyšší než vyšší organizmy Geny Jak si lze odvodit z výše napsaného, každá DNA obsahuje řádově stovky až tisíce genů základních fyzikálních a funkčních jednotek informace. Tato informace je použita při konstrukci proteinů, které se následně zapojují do konstrukce a procesů a reakčních cyklů uvnitř buňky katalyzující proteiny se nazývají enzymy. Geny se velmi liší ve své délce; často se rozprostírají přes tisíce bází. Prostor 21

22 mezi geny, který nenese žádnou informaci a nemá žádnou kódovací funkci zaplňují tzv. introny. Jejich délka se liší a typicky to bývají úseky tisíce bází dlouhé, některé však mohou mít i stovky tisíc bází na délku. Organismy jsou sestaveny prakticky zcela z proteinů. Jsou to velké složité molekuly tvořené z dlouhých řetězců podjednotek aminokyselin. Lidé jich mohou syntetizovat přinejmenším druhů. Proteiny se skládají z 20 druhů aminokyselin o jejichž kódování kodóny jsme se zmiňovali výše. Protein průměrné velikosti (3000bp base pairs párů bází) se tedy bude skládat přibližně z 1000 aminokyselin. Největší proteiny titiny, složky svalové sarkomery se skládají z téměř aminokyselin a mají molekulovou hmotnost téměř 3MDa (megadalton) [4]. Na této úrovni je genetický kód série kodónů určujících, které aminokyseliny na kterém místě budou použity pro vybudování konkrétního proteinu. Toto kódování ovšem neprobíhá přímo. Instrukce kódující protein jsou nejprve přeneseny na tzv. mrna (messenger RNA). RNA (ribonucleic acid; ribonukleová kyselina) je nukleová kyselina velmi podobná DNA ve stavebních kamenech s tím rozdílem, že místo thyminu (T) používá uracil (U) jak jsme již zmínili; důležitější však je, že RNA je jednovláknová. MRNA je tedy speciální druh RNA, který má jediný účel a to nechat do sebe otisknout (trascribe) genetickou informaci a poté ji po přesunu z jádra do cytoplasmy použít na stavbu proteinu (translation). Ta probíhá tak, že se na otištěné kodóny naváží příslušné aminokyseliny, které se zřetězí a vytvoří tak molekulu proteinu. Na obrázku 2 je celý proces názorně zachycen. 22

23 Obr. 2 Proces přepisu genetické informace do proteinů Chromozomy Tři miliardy párů bází jsou organizovány do 23 fyzikálně odlišných jednotek zvaných chromozomové páry. Všechny somatické lidské buňky (všechny s výjimkou pohlavních) obsahují dvě množiny chromozomů (říkáme že jsou diploidní) každá je od jednoho z rodičů, proto páry. Z těchto párů je 22 tzv. autosomů (nesexuálních chromozomů společných pro obě pohlaví) a dále jeden pár pohlavně specifický (chromozomy X a Y). Normální žena má pár chromozomů XX a normální muž má XY. Chromozomy jsou pozorovatelné mikroskopem (po obarvení speciálním barvivem) a lze je rozeznat jasně podle velikosti (největší chromozom č. 1 má cca. 245Mbp, nejmenší č. 21 má oproti tomu jen asi 47Mbp). Jevy a případné změny na úrovní DNA jsou ovšem příliš jemné a vyžadují molekulární analýzu. Tyto jemné DNA abnormality jsou odpovědné za různé dědičné choroby jako je anemie nebo cystická fibrióza nebo mohou mýt predispozicí pro vznik rakoviny popřípadě jiných složitých chorob. Je dobré zmínit, že podle počtu chromozomů nelze usuzovat například na 23

24 vyspělost druhu. Octomilka má 8 chromozomů, morče 16, člověk jak byl řečeno 46, drůbež 78 a motýli v závislosti na druhu až 380. Některé druhy rostlin pak 10, jiné i přes Velká většina genů v těchto organizmech je však soustředěna v několika málo velkých chromozomech; zbytek chromozomů je pak malý nebo vysloveně drobný (rozpadlé chromozomy) Genetická data Sekvenování DNA Sekvenování DNA je prosté určení sekvence nukleotidů uvnitř jednoho DNA řetězce druhý řetězec je jak jsem se již zmínil komplementární a jednoznačně odvoditelný. Sekvenování je tedy proces, kterým se převádí DNA sekvence do podoby dat, se kterými se pak dá pracovat pomocí prostředků na hromadné zpracování dat. Pro princip sekvenování existuje několik základní metody. Jednou z nich je například metoda chemické degradace, další je metoda terminace řetězců, která dnes jednoznačně převládá. Tato metoda používá jednovláknovou DNA jako vzor pro syntézu druhého komplementárního řetězce. Tato syntéza je zprostředkována enzymem polymerázou. Reakce je upravena tak, že v určitých místech (na určitých nukleotidech) dochází v závislosti na sekvenci vzorového vlákna k ukončení (terminaci) syntézy. Vznikají tak nedokončené řetězce komplementárního vlákna různých délek; a tyto délky je možné zjistit pomocí elektroforézy v gelu. Jelikož k ukončení reakce dochází ve chvíli, kdy se ve vzorovém vlákně vyskytne určitý nukleotid, tak délka odpovídá vzdálenosti od začátku vlákna, ve které se objevil tento nukleotid. Získáme tedy dílčí informaci o sekvenci známe pozici prvního výskytu 24

25 daného nukleotidu ve vzorovém vlákně. Syntéza se provádí tak, že se vždy hledají řetězce pro jeden konkrétní nukleotid. Trik této metody spočívá v tom, že se do reakce nepřidává pouze terminační dideoxynukleotid, ale také i normální partnerský deoxynukleotid v poměru 100:1. Další důležitým aspektem je, že reakce nikdy neobsahuje pouze jedno vzorové vlákno, ale velké množství těchto vláken se stejnou sekvencí. Při sekvenování tedy probíhá současně více syntéz nových komplementárních vláken. Vzorová vlákna budou vždy na stejných místech obsahovat např. guaniny, proti kterým bude DNA polymeráza do nového vlákna zařazovat cytosiny, které se budou náhodně vybírat z roztoku. Pokud tedy bude jeden ze sta cytosinů mít podobu terminačního dideoxynukleotidu, dojde k zastavení (terminaci) reakce jen u jednoho ze sta nově syntetizovaných vláken. U ostatních bude zařazen normální cytosin a syntéza tohoto vlákna bude pokračovat dále k dalšímu místu, kde kam bude potřeba na guanin navázat nějaký cytosin. V tomto momentu se opět zastaví 1% z dosud syntetizujících vláken. Na konci tohoto procesu tedy bude výsledkem reakce směs nových vláken, která budou dlouhá v závislosti na tom, kde se u nich syntéza zastavila. Po rozdělení v gelu a zjištění jejich délky v počtu párů tedy zjistíme pozice, na kterých se ve vzoru objevil guanin. Současné metody jsou schopné přímo sekvenovat jenom relativně krátké úseky DNA, nukleotidů; hlavním problémem je, že při dosažení této hranice chybí rozlišovací schopnost od sebe rozeznat dva úseky lišící se v délce o jeden nukleotid. Používaným řešením je, že se DNA (nejdelší chromozom = 250 milionů bází) mechanicky nebo pomocí speciálních enzymů rozstřihne na menší části, které se pak za pomocí vhodné bakterie namnoží (což ovšem nelze úplně vždy mj. kvůli vlivu této DNA na fungování hostitelské bakterie) a potom sekvenují s tím, že se s výhodou využije faktu, že se nová sekvence překrývá se nějakou vhodnou známou částí k přesné identifikaci jejího umístění (shotgun sekvenování). 25

26 Jak jsme již zmínili, lidský genom obsahuje zhruba bází. Při průměrné velikosti sekvenovaného fragmentu 500bp a zanedbání překryvů, je potřeba nejméně běhů k jeho úplnému osekvenování. I přes tuto zjevnou pomalost již v roce 1999 resp byly zveřejněny sekvence chromozomu 22 resp. 21. V současnosti uváděné sekvenční technologie jsou nadto schopny pracovat řádově rychleji než dřívější elektroforézní systémy Genové čipy Jiný přístup jak získat data z DNA je použít tzv. genové čipů, tzv. microarrays. Tato metoda se často se používá pro měření aktivity (exprese) genů v organismu. Vzhledem k tomu, že data zkoumaná v této práci mají původ právě v genových čipech, tuto problematiku zde trochu rozvedeme. Tato metoda je založena na technologii DNA prob; probu si lze představit jako jakousi sondu, sekvenci několika bází, která identifikuje určitý úsek DNA. Postup je následující. Vezmeme jedno vlákno DNA, toto vlákno budiž komplementární doplněk sekvence, kterou chceme hledat. Vložíme ho do ro roztoku, který obsahuje zkoumaný genetický materiál. V případě, že proba nalezne v roztoku svůj komplement, dojde ke spojení proby a tohoto komplementu ze zkoumaného genetického materiálu (tzv. hybridizaci). Trik této metody tkví v tom, že dříve než se zkoumaný genetický materiál (což bývá RNA získaná ze zkoumané DNA) vloží do roztoku, je opatřen fluorescentem. V technologii genetických čipů se tohoto využívá tak, že se proby ve velkém množství zafixují na konkrétní přesně dané pozice na čipu (což je většinou sklíčko nebo jiný speciální povrch), takže podle intenzity zbarvení lze v principu jednoduše určit kam se obarvená RNA uchytává, tj. jaké sekvence obsahuje. Často se toto pak provádí s různě zbarveným materiálem různého původu, takže lze okamžitě srovnat rozdíly ve 26

27 výskytu sekvencí ve vzorcích. Různý původ může například znamenat, že jeden materiál má původ ve zdravých buňkách a druhý v buňkách napadených rakovinou, buňkách na které byly aplikovány léky apod. Jak bylo řečeno, prob může být velké množství a hybridizace probíhá na všech současně, takže technologie dává poměrně rozsáhlé výsledky například pro bakterii E. coli, která je pro jednoduchý genom často vyhledávaným objektem experimentů, se na čip vejde dost prob pro nalezení všech jejích 4000 genů. Dále pak na každý čip je umístěno velké množství prob, které jsou stejné; jelikož ne každý proba je následně hybridizovaná v plné míře (dochází k částečné hybridizaci), je pro přesnější určení přítomnosti dané sondy ve zkoumaném vzorku (samplu) výhodné získané hodnoty tímto způsobem zprůměrovat. Tato data pak naskýtají vhodnou příležitost pro použití strojového učení. Následující obrázek č. 3 ukazuje, jak může genový čip a hybridizační procesy na něm vypadat. Obr. 3 Proces hybridizace na genovém čipu [5] Z obrázku je patrné, že délka RNA řetězců je výrazně větší než délka pro; typická délka v praxi používaných prob je asi 25 bází, oproti tomu typická délka 27

28 zkoumaného samplu je v tisících bází. Tato délka je dostatečná k identifikaci zkoumaných genů a na druhou stranu jsou proby dost krátké na to, aby nedocházelo k nežádoucím hybridizacím, například částečným hybridizacím nebo vzájemným hybridizacím dvou sond popřípadě jakési sebehybridizaci jedné sondy. Dále po ukončení fáze hybridizace je čip opláchnut, aby se smyla všechna nehybridizovaná (obarvená) DNA a pomocí optického mikroskopu se přečte hodnota intenzity fluorescence každého konkrétního vzorku na čipu Genomická data Ve stručnosti o tom, jak jsou nasbíraná data reprezentována a jak je s nimi manipulováno: existuje několik pohledů na to jak organizovat genomická data pro další využití lišící se v tom, co tvoří příklady (examples) a co vlastnosti (features). První možností je, že gen tvoří příklad a jeho exprese v různých podmínkách je množina vlastnosti. Druhý asi přirozenější přístup, který také používáme v této práci, je ten, že příklad je tvořený experimentem a jednotlivé rysy odpovídají jednotlivým genům. V této práci k těmto datům přistupujeme pomocí tzv. metody učení s učitelem; tj. vytvoříme model na trénovacích datech, kde pro každý příklad je přiřazena kategorie (rakovina ano ne, leukémie typ 1 typ 2). Na základě vytvořeného modelu pak jsme schopní rozhodnout pro do příkladů nezahrnuté případy o zařazení do kategorie. Pro experimenty byly použity dva zdroje dat: SAGE data a ALLAML. data. 28

29 SAGE data Serial Analysis of Gene Expression data alias SAGE data jsou microarray data s extrémně vysokou dimenzí a díky metodě měření jsou zde přítomny chyby ve velkém množství. Původním problémem nad těmito daty je správně oklasifikovat typ rakoviny, v našem případě však hledáme pravidla pouze pro třídy rakovina ano/ne. Tento data set má záměrně velmi diverzifikovaný původ (různé tkáně), aby bylo možné provést mezitkáňová srovnání. Pro velkou šíři záběru tyto data asi nemá smysl více rozebírat. Originální dataset obsahuje atributů a počet chyb dosahuje asi 10%[9]. V našem případě jsme však až s takto vysokodimenzionálními daty nepracovali a po redukci atributů na takové, které se projevily alespoň v několika situacích zůstalo asi atributů. Klasifikační přesnost CN2 bez injektové apriorní znalosti se na těchto datech pochybuje kolem 66% ALLAML data ALL vs. AML problém spočívá ve správném klasifikování vzorku s leukémií. Leukémie je jak asi všichni víme, nádorové onemocnění bílých krvinek. Abnormální bílé krvinky se množí na úkor červených krvinek i krevních destiček, čímž vyvolají anémii, krvácení a krevní výrony. V těžkých případech mohou v kostní dřeni úplně potlačit krvetvorbu. Leukémie lze rozdělit podle dvou atributů do čtyř skupin: jednak na akutní a chronické, dále pak na lymfocytické a myeloidní. Akutní leukémie je charakterizovaná rapidním šířením nezralých krevních buněk. Toto zahlcení způsobí, že kostní dřeň je následně neschopná tvořit zralé buňky, 29

30 kterých je pak logicky nedostatek. Tato nemoc je vyskytuje u dětí a dospívajících (v USA v této kategorii je to nejčastější příčina úmrtí mezi zhoubnými onemocněními). Chronická leukémie se liší tím, že kostní dřeň produkuje velké množství relativně vyspělých, ale stále nějak abnormálních buněk. Typicky trvá měsíce až roky než se vyvinou a jsou produkovány v daleko větším počtu než je běžné. Výsledkem je pak velké množství abnormálních bílých krvinek v krvi. Toto onemocnění je naopak časté u starších lidí. Rozdíl mezi lymfocytickou a myeloidní leukémií je v tom, který typ buněk zasahuje zda bílé krvinky (lymphocyty) nebo buňky kostní dřeně (myelocyty). Naučit strojově rozpoznávat a predikovat tento rozdíl je mj. naším úkolem v této práci. Příklady jsou rozděleny do dvou tříd: ALL (Acute Lymphocytic Leukemia) a AML (Acute Myelogenous Leukemia), k dispozici jich máme celkem 72. Každý má 7129 atributů/feature, což jsou numericky vyjádřené exprese genů. Vzhledem k tomu, že data mají poměrně kompaktní původ (jedna série měření zaměřená na jeden problém), jejich klasifikace je při použití např. CN2 poměrně daleko snazší resp. predikční síla větší než klasifikace SAGE dat, i když metoda získání (microarray) je u obou sad dat shodná. Originální neupravená data lze získat na této adrese: bin/cancer/publications/pub_paper.cgi?mode=view&paper_id=43, kde je také jejich popis a popis jejich získání. Klasifikační přesnost CN2 bez injektované apriorní znalosti se na těchto datech pochybuje kolem 87%. 30

31 Genové ontologie V této práci dále používáme genové ontologie, zde si je tedy stručně uvedeme. Gene ontology project (GO) poskytuje slovník vhodně volených termínů pro popis atributů genů a procesů týkajících se genů. GO popisuje tři základní struktury: molekulární funkce (molecular function; MF) biologické procesy (biological processes; BP) buněčné komponenty (cellular components) Molekulární funkce popisují různé aktivity genových produktů na molekulární úrovni; nepopisují ovšem kdy nebo kde se dějí. Biologické procesy popisují sérii prováděných akcí skládající se z více molekulárních funkcí. Buněčná komponenta je součást buňky (organela) nebo skupina genových produktů. V oblasti GO se hlavní úsilí soustředí na vytvoření a udržování GO, dále jejich propojení se spolupracujícími databázemi (DB obsahující data týkající se genomu člověka, zvířat, rostlin, bakterií apod.) a vytvoření nástrojů, které jsou schopné s GO efektivně pracovat nebo vytvářet je. Takováto sjednocená platforma pak umožňuje jednotné dotazování napříč spolupracujícími databázemi. GO výrazy jsou strukturovány tak, že je možné pomocí nich uplatnit různé pohledy na data. Každý genový produkt má alespoň jednu molekulární funkci a je použitý alespoň v jednom biologickém procesu v alespoň jedné buněčné komponentě. GO výrazy jsou organizované v orientovaném acyklickém grafu (directed acyclic graph; DAG). Pro první představu si lze DAGy znázornit jako větvemi propletené orientované stromy rozdíl oproti jednoduchému stromu je ten, že potomek může mít více předků; teorií grafů se zde ovšem nebudeme zabývat, pro případ potřeby či zájmu odkazuji na [10]. V GO platí pravidlo které říká, že pokud nějaký uzel grafu popisuje nějaký genový produkt, pak tento genový produkt musí popisovat i jeho předchůdce. 31

32 GO výrazy v každém případě nejsou úplným popisem celé složité struktury a všech jevů týkajících se genových produktů, umožňují nám přiřadit genům a jejich produktům pouze omezenou množinu atributů. Pomocí GO například není možné popsat v kterých buňkách, jejich vývojových stádiích nebo jakém širším kontextu (například chorob) se projevují tyto popisy jsou součástí jiných ontologií určených pro jiné účely. 32

33 1.3. Klasifikace CN2 Algoritmus CN2 byl uveden v roce 1988 [6], jeho princip je následující: při startu algoritmu máme prázdnou množinu pravidel a dokud existuje prvek v (nějak neurčitě definovanou funkcí určené) množině pravidel s výhodnou hodnotou výběrového kritéria (tj. jsou vhodná pro tvorbu pravidel), pak odstraníme z množiny examplů examply pokryté nejlépe vypadajícím pravidlem, a do množiny pravidel přiřadíme toto pravidlo implikující majoritní třídu těchto examplů. V pseudokódu toto vypadá přibližně následovně (pro uspořádanou variantu): def CN2 ( Examples ): # seznam examplů (n-tic s třídou) je vstupem, tj. schematicky: # Examples = [ [ [ att1... attn ], class ],...,... ] # seznam pravidel je prázdný ListOfRules = empty # získáme nejlepší vhodné pravidlo nebo empty množinu BestRule = GetBestRule(Examples) # dokud není množina examplů prázdná # nebo nejsou žádná vhodná pravidla while ( not Examples.empty() and not BestRule.empty() ): # odstraníme pravidlem pokryté examply E.remove( BestRule.coveredExamples() ) # do seznamu pravidel přidáme na konec pravidlo # indukující majoritní třídů pokrytých examplů ListOfRules.addRuleWithClass( BestRule, BestRule.coveredExamples().getMajorityClass() ) # získáme nejlepší vhodné pravidlo pro další cyklus BestRule = GetBestRule(Examples) 33

34 Je zjevné, že naprosto rozhodující roli na efektivitu algoritmu bude mít kvalita volby funkce GetBestRule. CN2 algoritmus tuto funkci implementuje pomocí paprskového prohledávání tak, že si udržuje množinu (paprsek) nejnadějnějších pravidel a tyto specializuje dokud to je možné a výhodné. Následující obrázek proces názorně ilustruje: TRUE ATT1 op C1 ATT2 op C2 ATTn op Cn ATT2 op C2 and ATT1 op C1 ATT2 op C2 and ATT3 op C3 ATTn op Cn and ATT2 op C2 Obr. 4 Paprskové procházení stavovým prostorem algoritmu CN2 V každém momentu si algoritmus pamatuje jenom určité množství nejnadějnějších pravidel (podle nějaké hodnotící funkce), které odpovídá šířce paprsku. Původní implementace CN2 toto realizuje poměrně zbytečně složitým způsobem tak, že skladuje seznam nadějných pravidel na velikostí omezené haldě a přebývající pravidla tedy přepadnou přes okraj (první myšlenka jak to realizovat, která se sama nabízí a může vás taktéž napadnout, ovšem není zrovna správná). Při defaultně malé šířce paprsku (<10) se ale jinak žádoucí asymptotická výhodnost této metody bezpečně nijak neprojevuje a realizace pomocí pole by mohla být dokonce výrazně výhodnější. Pokud jde o to jak vypadá toto paprskové prohledávání v kódu, pak následuje 34

Genetický kód. Jakmile vznikne funkční mrna, informace v ní obsažená může být ihned použita pro syntézu proteinu.

Genetický kód. Jakmile vznikne funkční mrna, informace v ní obsažená může být ihned použita pro syntézu proteinu. Genetický kód Jakmile vznikne funkční, informace v ní obsažená může být ihned použita pro syntézu proteinu. Pravidla, kterými se řídí prostřednictvím přenos z nukleotidové sekvence DNA do aminokyselinové

Více

Molekulární genetika IV zimní semestr 6. výukový týden ( )

Molekulární genetika IV zimní semestr 6. výukový týden ( ) Ústav biologie a lékařské genetiky 1.LF UK a VFN, Praha Molekulární genetika IV zimní semestr 6. výukový týden (5.11. 9.11.2007) Nondisjunkce u Downova syndromu 2 Tři rodokmeny rodin s dětmi postiženými

Více

Inovace studia molekulární a buněčné biologie

Inovace studia molekulární a buněčné biologie Inovace studia molekulární a buněčné biologie I n v e s t i c e d o r o z v o j e v z d ě l á v á n í reg. č. CZ.1.07/2.2.00/07.0354 Tento projekt je spolufinancován Evropským sociálním fondem a státním

Více

Molekulárn. rní genetika

Molekulárn. rní genetika Molekulárn rní genetika Centráln lní dogma molekulárn rní biologie cesta přenosu genetické informace: DNA RNA proteiny výjimkou reverzní transkripce retrovirů: RNA DNA Chemie nukleových kyselin dusíkaté

Více

Virtuální svět genetiky 1. Translace

Virtuální svět genetiky 1. Translace (překlad) je druhým krokem exprese genetické informace a ukončuje dráhu DNA > RNA > protein. probíhá mimo jádro, v cytoplazmě na ribozómech. Výchozími látkami pro translaci je 21 standardních aminokyselin,

Více

Populační genetika. ) a. Populační genetika. Castle-Hardy-Weinbergova zákonitost. Platí v panmiktické populaci za předpokladu omezujících podmínek

Populační genetika. ) a. Populační genetika. Castle-Hardy-Weinbergova zákonitost. Platí v panmiktické populaci za předpokladu omezujících podmínek Poulační genetika Poulační genetika ORGANISMUS Součást výše organizované soustavy oulace POPULACE Soubor jedinců jednoho druhu Genotyově heterogenní V určitém čase má řirozeně vymezený rostor Velký očet

Více

základní znaky živých systémů (definice života výčtem jeho vlastností) složitá organizace a řád regulace a udržování vnitřní homeostázy získávání a

základní znaky živých systémů (definice života výčtem jeho vlastností) složitá organizace a řád regulace a udržování vnitřní homeostázy získávání a definice života živý organismus je přirozeně se vyskytující sám sebe reprodukující systém, který vykonává řízené manipulace s hmotou, energií a informací základní znaky živých systémů (definice života

Více

Molekulární genetika

Molekulární genetika Molekulární genetika Upozornění: ukončení semestru ZÁPOČTOVÝ TEST a) Dědičnost krevně skupinových systémů (AB0, MN, Rh) b) Přepis úseku DNA do sekvence aminokyselin c) Populační genetika výpočet frekvence

Více

Molekulární základy dědičnosti. Ústřední dogma molekulární biologie Struktura DNA a RNA

Molekulární základy dědičnosti. Ústřední dogma molekulární biologie Struktura DNA a RNA Molekulární základy dědičnosti Ústřední dogma molekulární biologie Struktura DNA a RNA Ústřední dogma molekulární genetiky - vztah mezi nukleovými kyselinami a proteiny proteosyntéza replikace DNA RNA

Více

Molekulární genetika (Molekulární základy dědičnosti)

Molekulární genetika (Molekulární základy dědičnosti) Molekulární genetika (Molekulární základy dědičnosti) Struktura nukleové kyseliny Cukerná pentóza: 2-deoxy-D-ribóza D-ribóza Fosfátový zbytek: PO 4 3- Purin Pyrimidin Dusíkatá báze Adenin Guanin Tymin

Více

Propojení výuky oborů Molekulární a buněčné biologie a Ochrany a tvorby životního prostředí. Reg. č.: CZ.1.07/2.2.00/

Propojení výuky oborů Molekulární a buněčné biologie a Ochrany a tvorby životního prostředí. Reg. č.: CZ.1.07/2.2.00/ Propojení výuky oborů Molekulární a buněčné biologie a Ochrany a tvorby životního prostředí Reg. č.: CZ.1.07/2.2.00/28.0032 Molekulární genetika (Molekulární základy dědičnosti) 0 Gen - historie 1909 Johanssen

Více

Exprese genetické informace

Exprese genetické informace Exprese genetické informace Tok genetické informace DNA RNA Protein (výjimečně RNA DNA) DNA RNA : transkripce RNA protein : translace Gen jednotka dědičnosti sekvence DNA nutná k produkci funkčního produktu

Více

Studijní materiály pro bioinformatickou část ViBuChu. úloha II. Jan Komárek, Gabriel Demo

Studijní materiály pro bioinformatickou část ViBuChu. úloha II. Jan Komárek, Gabriel Demo Studijní materiály pro bioinformatickou část ViBuChu úloha II Jan Komárek, Gabriel Demo Adenin Struktura DNA Thymin 5 konec 3 konec DNA tvořena dvěmi řetězci orientovanými antiparalelně (liší se orientací

Více

Struktura a funkce nukleových kyselin

Struktura a funkce nukleových kyselin Struktura a funkce nukleových kyselin ukleové kyseliny Deoxyribonukleová kyselina - DA - uchovává genetickou informaci Ribonukleová kyselina RA - genová exprese a biosyntéza proteinů Složení A stavební

Více

NUKLEOVÉ KYSELINY. Základ života

NUKLEOVÉ KYSELINY. Základ života NUKLEOVÉ KYSELINY Základ života HISTORIE 1. H. Braconnot (30. léta 19. století) - Strassburg vinné kvasinky izolace matiére animale. 2. J.F. Meischer - experimenty z hnisem štěpení trypsinem odstředěním

Více

Typy nukleových kyselin. deoxyribonukleová (DNA); ribonukleová (RNA).

Typy nukleových kyselin. deoxyribonukleová (DNA); ribonukleová (RNA). Typy nukleových kyselin Existují dva typy nukleových kyselin (NA, z anglických slov nucleic acid): deoxyribonukleová (DNA); ribonukleová (RNA). DNA je lokalizována v buněčném jádře, RNA v cytoplasmě a

Více

Exprese genetické informace

Exprese genetické informace Exprese genetické informace Stavební kameny nukleových kyselin Nukleotidy = báze + cukr + fosfát BÁZE FOSFÁT Nukleosid = báze + cukr CUKR Báze Cyklické sloučeniny obsahující dusík puriny nebo pyrimidiny

Více

NUKLEOVÉ KYSELINY. Složení nukleových kyselin. Typy nukleových kyselin:

NUKLEOVÉ KYSELINY. Složení nukleových kyselin. Typy nukleových kyselin: NUKLEOVÉ KYSELINY Deoxyribonukleová kyselina (DNA, odvozeno z anglického názvu deoxyribonucleic acid) Ribonukleová kyselina (RNA, odvozeno z anglického názvu ribonucleic acid) Definice a zařazení: Nukleové

Více

Molekulárn. rní. biologie Struktura DNA a RNA

Molekulárn. rní. biologie Struktura DNA a RNA Molekulárn rní základy dědičnosti Ústřední dogma molekulárn rní biologie Struktura DNA a RNA Ústřední dogma molekulárn rní genetiky - vztah mezi nukleovými kyselinami a proteiny proteosyntéza replikace

Více

Exprese genetického kódu Centrální dogma molekulární biologie DNA RNA proteinu transkripce DNA mrna translace proteosyntéza

Exprese genetického kódu Centrální dogma molekulární biologie DNA RNA proteinu transkripce DNA mrna translace proteosyntéza Exprese genetického kódu Centrální dogma molekulární biologie - genetická informace v DNA -> RNA -> primárního řetězce proteinu 1) transkripce - přepis z DNA do mrna 2) translace - přeložení z kódu nukleových

Více

"Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Molekulární základy genetiky

Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT . Molekulární základy genetiky "Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Molekulární základy genetiky 1/76 GENY Označení GEN se používá ve dvou základních významech: 1. Jako synonymum pro vlohu

Více

b) Jak se změní sekvence aminokyselin v polypeptidu, pokud dojde v pozici 23 k záměně bázového páru GC za TA (bodová mutace) a s jakými následky?

b) Jak se změní sekvence aminokyselin v polypeptidu, pokud dojde v pozici 23 k záměně bázového páru GC za TA (bodová mutace) a s jakými následky? 1.1: Gén pro polypeptid, který je součástí peroxidázy buku lesního, má sekvenci 3'...TTTACAGTCCATTCGACTTAGGGGCTAAGGTACCTGGAGCCCACGTTTGGGTCATCCAG...5' 5'...AAATGTCAGGTAAGCTGAATCCCCGATTCCATGGACCTCGGGTGCAAACCCAGTAGGTC...3'

Více

Proteiny Genová exprese. 2013 Doc. MVDr. Eva Bártová, Ph.D.

Proteiny Genová exprese. 2013 Doc. MVDr. Eva Bártová, Ph.D. Proteiny Genová exprese 2013 Doc. MVDr. Eva Bártová, Ph.D. Bílkoviny (proteiny), 15% 1g = 17 kj Monomer = aminokyseliny aminová skupina karboxylová skupina α -uhlík postranní řetězec Znát obecný vzorec

Více

Projekt SIPVZ č.0636p2006 Buňka interaktivní výuková aplikace

Projekt SIPVZ č.0636p2006 Buňka interaktivní výuková aplikace Nukleové kyseliny Úvod Makromolekulární látky, které uchovávají a přenášejí informaci. Jsou to makromolekulární látky uspořádané do dlouhých. Řadí se mezi tzv.. Jsou přítomny ve buňkách a virech. Poprvé

Více

Dědičnost x proměnlivost Neboli heredita je schopnost organismů vytvářet potomky se stejnými nebo podobnými znaky. Je to jedna ze základních

Dědičnost x proměnlivost Neboli heredita je schopnost organismů vytvářet potomky se stejnými nebo podobnými znaky. Je to jedna ze základních Mgr. Zbyněk Houdek Doporučenálit.: Alberts, B. a kol.: Základy buněčné biologie (1998) Kočárek, E.: Genetika (2008) Kubišta, V.: Buněčné základy životních dějů (1998) Otová, B. a kol.: Lékařská biologie

Více

Schéma průběhu transkripce

Schéma průběhu transkripce Molekulární základy genetiky PROTEOSYNTÉZA A GENETICKÝ KÓD Proteosyntéza je složitý proces tvorby bílkovin, který zahrnuje proces přepisu genetické informace z DNA do kratšího zápisu v informační mrna

Více

Genetika zvířat - MENDELU

Genetika zvířat - MENDELU Genetika zvířat DNA - primární struktura Několik experimentů ve 40. a 50. letech 20. století poskytla důkaz, že genetický materiál je tvořen jedním ze dvou typů nukleových kyselin: DNA nebo RNA. DNA je

Více

2. Z následujících tvrzení, týkajících se prokaryotické buňky, vyberte správné:

2. Z následujících tvrzení, týkajících se prokaryotické buňky, vyberte správné: Výběrové otázky: 1. Součástí všech prokaryotických buněk je: a) DNA, plazmidy b) plazmidy, mitochondrie c) plazmidy, ribozomy d) mitochondrie, endoplazmatické retikulum 2. Z následujících tvrzení, týkajících

Více

"Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Základy genetiky, základní pojmy

Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT . Základy genetiky, základní pojmy "Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Základy genetiky, základní pojmy 1/75 Genetika = věda o dědičnosti Studuje biologickou informaci. Organizmy uchovávají,

Více

Nukleové kyseliny Replikace Transkripce, RNA processing Translace

Nukleové kyseliny Replikace Transkripce, RNA processing Translace ukleové kyseliny Replikace Transkripce, RA processing Translace Prokaryotická X eukaryotická buňka Hlavní rozdíl organizace genetického materiálu (u prokaryot není ohraničen) Život závisí na schopnosti

Více

Deoxyribonukleová kyselina (DNA)

Deoxyribonukleová kyselina (DNA) Genetika Dědičností rozumíme schopnost rodičů předávat své vlastnosti potomkům a zachovat tak rozličnost druhů v přírodě. Dědičností a proměnlivostí jedinců se zabývá vědní obor genetika. Základní jednotkou

Více

Nukleosidy, nukleotidy, nukleové kyseliny, genetická informace

Nukleosidy, nukleotidy, nukleové kyseliny, genetická informace Nukleosidy, nukleotidy, nukleové kyseliny, genetická informace Centrální dogma Nukleové kyseliny Fosfátem spojené nukleotidy (cukr s navázanou bází a fosfátem) Nukleotidy Nukleotidy stavební kameny nukleových

Více

Tomáš Oberhuber. Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Tomáš Oberhuber. Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague Tomáš Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague Buňka buňka je základní stavební prvek všech živých organismů byla objevena Robertem Hookem roku 1665 jednodušší

Více

Evoluční algoritmy. Podmínka zastavení počet iterací kvalita nejlepšího jedince v populaci změna kvality nejlepšího jedince mezi iteracemi

Evoluční algoritmy. Podmínka zastavení počet iterací kvalita nejlepšího jedince v populaci změna kvality nejlepšího jedince mezi iteracemi Evoluční algoritmy Použítí evoluční principů, založených na metodách optimalizace funkcí a umělé inteligenci, pro hledání řešení nějaké úlohy. Populace množina jedinců, potenciálních řešení Fitness function

Více

Inovace studia molekulární a buněčné biologie

Inovace studia molekulární a buněčné biologie Inovace studia molekulární a buněčné biologie Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. MBIO1/Molekulární biologie 1 Tento projekt je spolufinancován

Více

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY

Více

Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled

Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled Bioinformatika a výpočetní biologie KFC/BIN I. Přehled RNDr. Karel Berka, Ph.D. Univerzita Palackého v Olomouci Definice bioinformatiky (Molecular) bio informatics: bioinformatics is conceptualising biology

Více

7. Regulace genové exprese, diferenciace buněk a epigenetika

7. Regulace genové exprese, diferenciace buněk a epigenetika 7. Regulace genové exprese, diferenciace buněk a epigenetika Aby mohl mnohobuněčný organismus efektivně fungovat, je třeba, aby se jednotlivé buňky specializovaly na určité funkce. Nový jedinec přitom

Více

Centrální dogma molekulární biologie

Centrální dogma molekulární biologie řípravný kurz LF MU 2011/12 Centrální dogma molekulární biologie Nukleové kyseliny 1865 zákony dědičnosti (Johann Gregor Mendel) 1869 objev nukleových kyselin (Miescher) 1944 genetická informace v nukleových

Více

Výukový materiál zpracován v rámci projektu EU peníze školám

Výukový materiál zpracován v rámci projektu EU peníze školám http://vtm.zive.cz/aktuality/vzorek-dna-prozradi-priblizny-vek-pachatele Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Eva Strnadová. Dostupné z Metodického portálu www.rvp.cz ;

Více

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 1 / 23 Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 2 / 23 biologové často potřebují najít často se opakující sekvence DNA tyto sekvence bývají relativně krátké,

Více

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

Obsah přednášky Jaká asi bude chyba modelu na nových datech? Obsah přednášky Jaká asi bude chyba modelu na nových datech? Chyba modelu Bootstrap Cross Validation Vapnik-Chervonenkisova dimenze 2 Chyba skutečná a trénovací Máme 30 záznamů, rozhodli jsme se na jejich

Více

Genomické databáze. Shlukování proteinových sekvencí. Ivana Rudolfová. školitel: doc. Ing. Jaroslav Zendulka, CSc.

Genomické databáze. Shlukování proteinových sekvencí. Ivana Rudolfová. školitel: doc. Ing. Jaroslav Zendulka, CSc. Genomické databáze Shlukování proteinových sekvencí Ivana Rudolfová školitel: doc. Ing. Jaroslav Zendulka, CSc. Obsah Proteiny Zdroje dat Predikce struktury proteinů Cíle disertační práce Vstupní data

Více

Nukleové kyseliny. DeoxyriboNucleic li Acid

Nukleové kyseliny. DeoxyriboNucleic li Acid Molekulární lární genetika Nukleové kyseliny DeoxyriboNucleic li Acid RiboNucleic N li Acid cukr (deoxyrobosa, ribosa) fosforečný zbytek dusíkatá báze Dusíkaté báze Dvouvláknová DNA Uchovává genetickou

Více

Nukleové kyseliny příručka pro učitele. Obecné informace:

Nukleové kyseliny příručka pro učitele. Obecné informace: Obecné informace: Nukleové kyseliny příručka pro učitele Téma Nukleové kyseliny je završením základních kapitol z popisné chemie a je tedy zařazeno až na její závěr. Probírá se v rámci jedné, eventuálně

Více

GENETIKA dědičností heredita proměnlivostí variabilitu Dědičnost - heredita podobnými znaky genetickou informací Proměnlivost - variabilita

GENETIKA dědičností heredita proměnlivostí variabilitu Dědičnost - heredita podobnými znaky genetickou informací Proměnlivost - variabilita GENETIKA - věda zabývající se dědičností (heredita) a proměnlivostí (variabilitu ) živých soustav - sleduje rozdílnost a přenos dědičných znaků mezi rodiči a potomky Dědičnost - heredita - schopnost organismu

Více

Využití metod strojového učení v bioinformatice David Hoksza

Využití metod strojového učení v bioinformatice David Hoksza Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace

Více

6. Nukleové kyseliny

6. Nukleové kyseliny 6. ukleové kyseliny ukleové kyseliny jsou spolu s proteiny základní a nezbytnou složkou živé hmoty. lavní jejich funkce je uchování genetické informace a její přenos do dceřinné buňky. ukleové kyseliny

Více

Algoritmy I, složitost

Algoritmy I, složitost A0B36PRI - PROGRAMOVÁNÍ Algoritmy I, složitost České vysoké učení technické Fakulta elektrotechnická v 1.01 Rychlost... Jeden algoritmus (program, postup, metoda ) je rychlejší než druhý. Co ta věta znamená??

Více

Algoritmizace Dynamické programování. Jiří Vyskočil, Marko Genyg-Berezovskyj 2010

Algoritmizace Dynamické programování. Jiří Vyskočil, Marko Genyg-Berezovskyj 2010 Dynamické programování Jiří Vyskočil, Marko Genyg-Berezovskyj 2010 Rozděl a panuj (divide-and-conquer) Rozděl (Divide): Rozděl problém na několik podproblémů tak, aby tyto podproblémy odpovídaly původnímu

Více

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti. Vztah struktury a funkce nukleových kyselin. Replikace, transkripce

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti. Vztah struktury a funkce nukleových kyselin. Replikace, transkripce Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Vztah struktury a funkce nukleových kyselin. Replikace, transkripce Nukleová kyselina gen základní jednotka informace v živých systémech,

Více

DNA TECHNIKY IDENTIFIKACE ŽIVOČIŠNÝCH DRUHŮ V KRMIVU A POTRAVINÁCH. Michaela Nesvadbová

DNA TECHNIKY IDENTIFIKACE ŽIVOČIŠNÝCH DRUHŮ V KRMIVU A POTRAVINÁCH. Michaela Nesvadbová DNA TECHNIKY IDENTIFIKACE ŽIVOČIŠNÝCH DRUHŮ V KRMIVU A POTRAVINÁCH Michaela Nesvadbová Význam identifikace živočišných druhů v krmivu a potravinách povinností každého výrobce je řádně a pravdivě označit

Více

Stromy. Karel Richta a kol. Katedra počítačů Fakulta elektrotechnická České vysoké učení technické v Praze Karel Richta a kol.

Stromy. Karel Richta a kol. Katedra počítačů Fakulta elektrotechnická České vysoké učení technické v Praze Karel Richta a kol. Stromy Karel Richta a kol. Katedra počítačů Fakulta elektrotechnická České vysoké učení technické v Praze Karel Richta a kol., 2018, B6B36DSA 01/2018, Lekce 9 https://cw.fel.cvut.cz/wiki/courses/b6b36dsa/start

Více

Molekulární genetika. DNA = deoxyribonukleová kyselina. RNA = ribonukleová kyselina

Molekulární genetika. DNA = deoxyribonukleová kyselina. RNA = ribonukleová kyselina Přehled GMH Seminář z biologie GENETIKA Molekulární genetika Základní dogma molekulární biologie Základním nosičem genetické informace je molekula DNA. Tato molekula se může replikovat (kopírovat). Informace

Více

TEST: GENETIKA, MOLEKULÁRNÍ BIOLOGIE

TEST: GENETIKA, MOLEKULÁRNÍ BIOLOGIE TEST: GENETIKA, MOLEKULÁRNÍ BIOLOGIE 1) Důležitým biogenním prvkem, obsaženým v nukleových kyselinách nebo ATP a nezbytným při tvorbě plodů je a) draslík b) dusík c) vápník d) fosfor 2) Sousedící nukleotidy

Více

Translace (druhý krok genové exprese)

Translace (druhý krok genové exprese) Translace (druhý krok genové exprese) Od RN k proteinu Milada Roštejnská Helena Klímová 1 enetický kód trn minoacyl-trn-synthetasa Translace probíhá na ribosomech Iniciace translace Elongace translace

Více

Dokumentace programu piskvorek

Dokumentace programu piskvorek Dokumentace programu piskvorek Zápočtového programu z Programování II PRM045 Ondřej Vostal 20. září 2011, Letní semestr, 2010/2011 1 Stručné zadání Napsat textovou hru piškvorky se soupeřem s umělou inteligencí.

Více

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21. Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 21. září 2018 Jiří Dvorský (VŠB TUO) Vyhledávání 242 / 433 Osnova přednášky

Více

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti URČOVÁNÍ PRIMÁRNÍ STRUKTURY BÍLKOVIN

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti URČOVÁNÍ PRIMÁRNÍ STRUKTURY BÍLKOVIN Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti URČOVÁNÍ PRIMÁRNÍ STRUKTURY BÍLKOVIN Primární struktura primární struktura bílkoviny je dána pořadím AK jejích polypeptidových řetězců

Více

Projekt realizovaný na SPŠ Nové Město nad Metují

Projekt realizovaný na SPŠ Nové Město nad Metují Projekt realizovaný na SPŠ Nové Město nad Metují s finanční podporou v Operačním programu Vzdělávání pro konkurenceschopnost Královéhradeckého kraje Modul 02 Přírodovědné předměty Hana Gajdušková 1 Viry

Více

ve srovnání s eukaryoty (životnost v řádu hodin) u prokaryot kratší (životnost v řádu minut) na životnost / stabilitu molekuly mají vliv

ve srovnání s eukaryoty (životnost v řádu hodin) u prokaryot kratší (životnost v řádu minut) na životnost / stabilitu molekuly mají vliv Urbanová Anna ve srovnání s eukaryoty (životnost v řádu hodin) u prokaryot kratší (životnost v řádu minut) na životnost / stabilitu molekuly mají vliv strukturní rysy mrna proces degradace každá mrna v

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FRAKTÁL V SEKVENCI DNA BAKALÁŘSKÁ PRÁCE FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV RADIOELEKTRONIKY

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FRAKTÁL V SEKVENCI DNA BAKALÁŘSKÁ PRÁCE FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV RADIOELEKTRONIKY VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV RADIOELEKTRONIKY FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT OF

Více

Molekulární základ dědičnosti

Molekulární základ dědičnosti Molekulární základ dědičnosti Dědičná informace je zakódována v deoxyribonukleové kyselině, která je uložena v jádře buňky v chromozómech. Zlomovým objevem pro další rozvoj molekulární genetiky bylo odhalení

Více

Algoritmus pro hledání nejkratší cesty orientovaným grafem

Algoritmus pro hledání nejkratší cesty orientovaným grafem 1.1 Úvod Algoritmus pro hledání nejkratší cesty orientovaným grafem Naprogramoval jsem v Matlabu funkci, která dokáže určit nejkratší cestu v orientovaném grafu mezi libovolnými dvěma vrcholy. Nastudoval

Více

Josef Reischig, Jiří Hatina, Marie Ludvíková OBECNÁ GENETIKA. Praktická cvičení

Josef Reischig, Jiří Hatina, Marie Ludvíková OBECNÁ GENETIKA. Praktická cvičení Josef Reischig, Jiří Hatina, Marie Ludvíková OBECNÁ GENETIKA Praktická cvičení Popis průběhu spermatogeneze a meiózv u sarančat Spermatocyty I. řádu po proběhlé S fázi (2n, 4C) prochází prvním meiotickým

Více

Gymnázium, Brno, Elgartova 3

Gymnázium, Brno, Elgartova 3 Gymnázium, Brno, Elgartova 3 Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: GE Vyšší kvalita výuky Číslo projektu: CZ.1.07/1.5.00/34.0925 Autor: Mgr. Hana Křivánková Téma:

Více

Genetika. Genetika. Nauka o dědid. dičnosti a proměnlivosti. molekulárn. rní buněk organismů populací

Genetika. Genetika. Nauka o dědid. dičnosti a proměnlivosti. molekulárn. rní buněk organismů populací Genetika Nauka o dědid dičnosti a proměnlivosti Genetika molekulárn rní buněk organismů populací Dědičnost na úrovni nukleových kyselin Předávání vloh z buňky na buňku Předávání vlastností mezi jednotlivci

Více

1. Téma : Genetika shrnutí Název DUMu : VY_32_INOVACE_29_SPSOA_BIO_1_CHAM 2. Vypracovala : Hana Chamulová 3. Vytvořeno v projektu EU peníze středním

1. Téma : Genetika shrnutí Název DUMu : VY_32_INOVACE_29_SPSOA_BIO_1_CHAM 2. Vypracovala : Hana Chamulová 3. Vytvořeno v projektu EU peníze středním 1. Téma : Genetika shrnutí Název DUMu : VY_32_INOVACE_29_SPSOA_BIO_1_CHAM 2. Vypracovala : Hana Chamulová 3. Vytvořeno v projektu EU peníze středním školám Genetika - shrnutí TL2 1. Doplň: heterozygot,

Více

ALGORITMIZACE 2010/03 STROMY, BINÁRNÍ STROMY VZTAH STROMŮ A REKURZE ZÁSOBNÍK IMPLEMENTUJE REKURZI PROHLEDÁVÁNÍ S NÁVRATEM (BACKTRACK)

ALGORITMIZACE 2010/03 STROMY, BINÁRNÍ STROMY VZTAH STROMŮ A REKURZE ZÁSOBNÍK IMPLEMENTUJE REKURZI PROHLEDÁVÁNÍ S NÁVRATEM (BACKTRACK) ALGORITMIZACE 2010/03 STROMY, BINÁRNÍ STROMY VZTAH STROMŮ A REKURZE ZÁSOBNÍK IMPLEMENTUJE REKURZI PROHLEDÁVÁNÍ S NÁVRATEM (BACKTRACK) Strom / tree uzel, vrchol / node, vertex hrana / edge vnitřní uzel

Více

Bílkoviny a rostlinná buňka

Bílkoviny a rostlinná buňka Bílkoviny a rostlinná buňka Bílkoviny Rostliny --- kontinuální diferenciace vytváření orgánů: - mitotická dělení -zvětšování buněk a tvorba buněčné stěny syntéza bílkovin --- fotosyntéza syntéza bílkovin

Více

Tabulka 1. Výběr z datové tabulky

Tabulka 1. Výběr z datové tabulky 1. Zadání domácího úkolu Vyberte si datový soubor obsahující alespoň jednu kvalitativní a jednu kvantitativní proměnnou s alespoň 30 statistickými jednotkami (alespoň 30 jednotlivých údajů). Zdroje dat

Více

Hemoglobin a jemu podobní... Studijní materiál. Jan Komárek

Hemoglobin a jemu podobní... Studijní materiál. Jan Komárek Hemoglobin a jemu podobní... Studijní materiál Jan Komárek Bioinformatika Bioinformatika je vědní disciplína, která se zabývá metodami pro shromážďování, analýzu a vizualizaci rozsáhlých souborů biologických

Více

ENZYMY A NUKLEOVÉ KYSELINY

ENZYMY A NUKLEOVÉ KYSELINY ENZYMY A NUKLEOVÉ KYSELINY Autor: Mgr. Stanislava Bubíková Datum (období) tvorby: 28. 3. 2013 Ročník: devátý Vzdělávací oblast: Člověk a příroda / Chemie / Organické sloučeniny 1 Anotace: Žáci se seznámí

Více

Struktura proteinů. - testík na procvičení. Vladimíra Kvasnicová

Struktura proteinů. - testík na procvičení. Vladimíra Kvasnicová Struktura proteinů - testík na procvičení Vladimíra Kvasnicová Mezi proteinogenní aminokyseliny patří a) kyselina asparagová b) kyselina glutarová c) kyselina acetoctová d) kyselina glutamová Mezi proteinogenní

Více

Úloha protein-nekódujících transkriptů ve virulenci patogenních bakterií

Úloha protein-nekódujících transkriptů ve virulenci patogenních bakterií Téma bakalářské práce: Úloha protein-nekódujících transkriptů ve virulenci patogenních bakterií Nové odvětví molekulární biologie se zabývá RNA molekulami, které se nepřekládají do proteinů, ale slouží

Více

Aminokyseliny příručka pro učitele. Obecné informace: Téma otevírá kapitolu Bílkoviny, která svým rozsahem překračuje rámec jedné vyučovací hodiny.

Aminokyseliny příručka pro učitele. Obecné informace: Téma otevírá kapitolu Bílkoviny, která svým rozsahem překračuje rámec jedné vyučovací hodiny. Obecné informace: Aminokyseliny příručka pro učitele Téma otevírá kapitolu Bílkoviny, která svým rozsahem překračuje rámec jedné vyučovací hodiny. Navazující učivo Před probráním tématu Aminokyseliny probereme

Více

OBSAH 1 ÚVOD... 7. 1.1 Výrobek a materiál... 7 1.2 Přehled a klasifikace materiálů pro výrobu... 8 2 ZDROJE DŘEVA... 13

OBSAH 1 ÚVOD... 7. 1.1 Výrobek a materiál... 7 1.2 Přehled a klasifikace materiálů pro výrobu... 8 2 ZDROJE DŘEVA... 13 OBSAH 1 ÚVOD................................................. 7 1.1 Výrobek a materiál........................................ 7 1.2 Přehled a klasifikace materiálů pro výrobu..................... 8 2

Více

REPLIKACE A REPARACE DNA

REPLIKACE A REPARACE DNA REPLIKACE A REPARACE DNA 1 VÝZNAM REPARACE DNA V MEDICÍNĚ Příklad: Reparace DNA: enzymy reparace nukleotidovou excizí Onemocnění: xeroderma pigmentosum 2 3 REPLIKACE A REPARACE DNA: Replikace DNA: 1. Podstata

Více

Těsně před infarktem. Jak předpovědět infarkt pomocí informatických metod. Jan Kalina, Marie Tomečková

Těsně před infarktem. Jak předpovědět infarkt pomocí informatických metod. Jan Kalina, Marie Tomečková Těsně před infarktem Jak předpovědět infarkt pomocí informatických metod Jan Kalina, Marie Tomečková Program, osnova sdělení 13,30 Úvod 13,35 Stručně o ateroskleróze 14,15 Měření genových expresí 14,00

Více

USING OF AUTOMATED DNA SEQUENCING FOR PORCINE CANDIDATE GENES POLYMORFISMS DETECTION

USING OF AUTOMATED DNA SEQUENCING FOR PORCINE CANDIDATE GENES POLYMORFISMS DETECTION USING OF AUTOMATED DNA SEQUENCING FOR PORCINE CANDIDATE GENES POLYMORFISMS DETECTION VYUŽITÍ AUTOMATICKÉHO SEKVENOVÁNÍ DNA PRO DETEKCI POLYMORFISMŮ KANDIDÁTNÍCH GENŮ U PRASAT Vykoukalová Z., Knoll A.,

Více

TRANSLACE - SYNTÉZA BÍLKOVIN

TRANSLACE - SYNTÉZA BÍLKOVIN TRANSLACE - SYNTÉZA BÍLKOVIN Translace - překlad genetické informace z jazyka nukleotidů do jazyka aminokyselin podle pravidel genetického kódu. Genetický kód - způsob zápisu genetické informace Kód Morseovy

Více

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.

Více

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte

Více

AUG STOP AAAA S S. eukaryontní gen v genomové DNA. promotor exon 1 exon 2 exon 3 exon 4. kódující oblast. introny

AUG STOP AAAA S S. eukaryontní gen v genomové DNA. promotor exon 1 exon 2 exon 3 exon 4. kódující oblast. introny eukaryontní gen v genomové DNA promotor exon 1 exon 2 exon 3 exon 4 kódující oblast introny primární transkript (hnrna, pre-mrna) postranskripční úpravy (vznik maturované mrna) syntéza čepičky AUG vyštěpení

Více

Paralelní grafové algoritmy

Paralelní grafové algoritmy Paralelní grafové algoritmy Značení Minimální kostra grafu Nejkratší cesta z jednoho uzlu Nejkratší cesta mezi všemi dvojicemi uzlů Použité značení Definition Bud G = (V, E) graf. Pro libovolný uzel u

Více

Struktura a funkce biomakromolekul

Struktura a funkce biomakromolekul Struktura a funkce biomakromolekul KBC/BPOL 7. Interakce DNA/RNA - protein Ivo Frébort Interakce DNA/RNA - proteiny v buňce Základní dogma molekulární biologie Replikace DNA v E. coli DNA polymerasa a

Více

Rozdělování dat do trénovacích a testovacích množin

Rozdělování dat do trénovacích a testovacích množin Rozdělování dat do trénovacích a testovacích množin Marcel Jiřina Rozpoznávání je důležitou metodou při zpracování reálných úloh. Rozpoznávání je definováno dvěma kroky a to pořízením dat o reálném rozpoznávaném

Více

Struktura biomakromolekul

Struktura biomakromolekul Struktura biomakromolekul ejvýznamnější biomolekuly proteiny nukleové kyseliny polysacharidy lipidy... měli bychom znát stavební kameny života Proteiny Aminokyseliny tvořeny aminokyselinami L-α-aminokyselinami

Více

Biologie - Oktáva, 4. ročník (humanitní větev)

Biologie - Oktáva, 4. ročník (humanitní větev) - Oktáva, 4. ročník (humanitní větev) Biologie Výchovné a vzdělávací strategie Kompetence k řešení problémů Kompetence komunikativní Kompetence sociální a personální Kompetence občanská Kompetence k podnikavosti

Více

Obecná biologie a genetika B53 volitelný předmět pro 4. ročník

Obecná biologie a genetika B53 volitelný předmět pro 4. ročník Obecná biologie a genetika B53 volitelný předmět pro 4. ročník Charakteristika vyučovacího předmětu Vyučovací předmět vychází ze vzdělávací oblasti Člověk a příroda, vzdělávacího oboru Biologie. Mezipředmětové

Více

6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života?

6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života? 6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života? Pamatujete na to, co se objevilo v pracích Charlese Darwina a Alfreda Wallace ohledně vývoje druhů? Aby mohl mechanismus přírodního

Více

Nukleové kyseliny Milan Haminger BiGy Brno 2017

Nukleové kyseliny Milan Haminger BiGy Brno 2017 ukleové kyseliny Milan aminger BiGy Brno 2017 ukleové kyseliny jsou spolu s proteiny základní a nezbytnou složkou živé hmoty. lavní jejich funkce je uchování genetické informace a její přenos do dceřinné

Více

Nukleové kyseliny. obecný přehled

Nukleové kyseliny. obecný přehled Nukleové kyseliny obecný přehled Nukleové kyseliny objeveny r.1868, izolovány koncem 19.stol., 1953 objasněno jejich složení Watsonem a Crickem (1962 Nobelova cena) biopolymery nositelky genetické informace

Více

Mutace jako změna genetické informace a zdroj genetické variability

Mutace jako změna genetické informace a zdroj genetické variability Obecná genetika Mutace jako změna genetické informace a zdroj genetické variability Doc. RNDr. Ing. Eva PALÁTOVÁ, PhD. Ing. Roman LONGAUER, CSc. Ústav zakládání a pěstění lesů LDF MENDELU Brno Tento projekt

Více

Základy molekulární a buněčné biologie. Přípravný kurz Komb.forma studia oboru Všeobecná sestra

Základy molekulární a buněčné biologie. Přípravný kurz Komb.forma studia oboru Všeobecná sestra Základy molekulární a buněčné biologie Přípravný kurz Komb.forma studia oboru Všeobecná sestra Genetický aparát buňky DNA = nositelka genetické informace - dvouvláknová RNA: jednovláknová mrna = messenger

Více

Nukleové kyseliny. Nukleové kyseliny. Genetická informace. Gen a genom. Složení nukleových kyselin. Centrální dogma molekulární biologie

Nukleové kyseliny. Nukleové kyseliny. Genetická informace. Gen a genom. Složení nukleových kyselin. Centrální dogma molekulární biologie Centrální dogma molekulární biologie ukleové kyseliny 1865 zákony dědičnosti (Johann Gregor Transkripce D R Translace rotein Mendel) Replikace 1869 objev nukleových kyselin (Miescher) 1944 nukleové kyseliny

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Genetika: cvičení č. 1-2 DNA, RNA, replikace, transkripce, translace a genetický kód, mutace. KBI/GENE Mgr. Zbyněk Houdek

Genetika: cvičení č. 1-2 DNA, RNA, replikace, transkripce, translace a genetický kód, mutace. KBI/GENE Mgr. Zbyněk Houdek Genetika: cvičení č. 1-2 DNA, RNA, replikace, transkripce, translace a genetický kód, mutace KBI/GENE Mgr. Zbyněk Houdek Témata cvičení 1. DNA, RNA, replikace, transkripce, translace, genetický kód, centrální

Více