ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE. Klasifikace s apriorní znalostí

Rozměr: px
Začít zobrazení ze stránky:

Download "ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE. Klasifikace s apriorní znalostí"

Transkript

1 ZADÁNÍ 1

2 ZADÁNÍ 2

3 ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Katedra počítačů Bakalářská práce Klasifikace s apriorní znalostí červen 2007 Vypracoval: Michal Trna Vedoucí práce: Ing. Jiří Kléma, PhD. 3

4 BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE 4

5 Poděkování Chtěl bych na tomto místě poděkovat všem, kteří mi jakýkoli způsobem pomáhali při vzniku této práce. Zvláště děkuji vedoucímu mé bakalářské práce Ing. Jiřímu Klémovi, PhD. za odbornou pomoc a svému počítači za stovky hodin procesorového času. 5

6 BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE 6

7 Čestné prohlášení Prohlašuji, že jsem zadanou bakalářskou práci vypracoval samostatně s přispěním vedoucího práce a použil jsem pouze podklady uvedené v přiloženém seznamu. Dále prohlašuji, že nemám závažný důvod proti užití tohoto díla ve smyslu 60 Zákona č. 121/2000 Sb., o právu autorském, o právech souvisejících s právem autorským a o změně některých zákonů (autorský zákon). V Praze dne podpis 7

8 BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE 8

9 ABSTRAKT Oblast analýzy biomedicínských dat je poměrně mladá disciplína a v současnosti se velmi rychle rozvíjí. Problémy zpracování těchto specifických dat vybízí k vyvinutí nových efektivních metod, k čemuž má přispět i tato práce; zabýváme se v ní implementací a vyhodnocením výsledků modifikovaného klasifikátoru CN2. Nově dodaným prvkem v něm je zvažování použití apriorní znalosti získané z popisů atributů, v našem případě genů. Různé přístupy použití této znalosti při stavbě klasifikačních pravidel zde pak rozebíráme a vyhodnocujeme. ABSTRACT The analysis of biomedical data is quite young and rapidly developing discipline at present. Problems of processing such specific data provokes us to develop new effective methods, whereto this work should contribute. It inquires into the implementation and evaluation of results of the modified algorithm CN2. The newly added aspect to this algorithm is consideration of usage of the knowledge extracted from annotations of attributes, in our case genes. Various approaches of usage of this knowledge in the building process of classification rules are analysed and interpreted. 9

10 BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE 10

11 Obsah Obsah 11 Seznam obrázků 13 Seznam grafů 14 Seznam tabulek 15 1 Úvod Úvod do genetiky DNA Geny Chromozomy Genomická data Sekvenování DNA Genové čipy Genomická data SAGE data AML ALL data Genové ontologie Klasifikace CN Křížová validace 37 2 Injekce apriorní znalosti Získání termínů z genových popisů Získání matice podobnosti Úpravy v CN

12 3 Experimenty 45 4 Závěr 53 A. Seznam zkratek 54 B. Reference 55 C. Příloha 57 I. Obsah přiloženého média 57 II. Popis částí zdrojového kódu 58 III.Popis instalace a spouštění CN2 61 IV.Popisy přiložených skriptů 62 12

13 Seznam obrázků Obr. 1. Struktura DNA 20 Obr. 2. Proces přepisu genetické informace do proteinů 23 Obr. 3. Proces hybridizace na genovém čipu 27 Obr. 4 Paprskové procházení stavovým prostorem algoritmu CN

14 Seznam grafů Graf 1. Kl. přesnost CN2 s bg. knowledge z GO BP injektovanou do primusu 45 Graf 2. Kl. přesnost CN2 s bg. knowledge z GO MF injektovanou do primusu 46 Graf 3. Kl. přesnost CN2 s bg. knowledge z GO BP injektovanou do primusu 47 Graf 4. Kl. přesnost CN2 s bg. knowledge z GO MF injektovanou do primusu 47 Graf 5. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do primusu 48 Graf 6. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do primusu 48 Graf 7. Kl. přesnost CN2 s bg. knowledge z GO BP/MF injektovanou do secundusu 49 Graf 8. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do secundusu 50 Graf 9. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do secundusu 50 Graf 10. Kl. přesnost CN2 s feature selection 51 14

15 Seznam tabulek Tab. 0. Významy kodónů krátká označení aminokyselin a příslušné kodóny 20 Tab. 1. Kl. přesnost CN2 s bg. knowledge z GO BP injektovanou do primusu 45 Tab. 2. Kl. přesnost CN2 s bg. knowledge z GO MF injektovanou do primusu 46 Tab. 3. Kl. přesnost CN2 s bg. knowledge z GO BP injektovanou do primusu 47 Graf 4. Kl. přesnost CN2 s bg. knowledge z GO MF injektovanou do primusu 47 Tab. 5. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do primusu 48 Tab. 6. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do primusu 48 Tab. 7. Kl. přesnost CN2 s bg. knowledge z GO BP/MF injektovanou do secundusu 49 Tab. 8. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do secundusu 50 Tab. 9. Kl. přesnost CN2 s bg. knowledge z ALLAML injektovanou do secundusu 50 15

16 BLANKPAGE BLANKPAGE BLANKPAGE BLANKPAGE 16

17 1. Úvod Informační společnost generuje a kumuluje ohromná množství dat, která ve své surové podobě nezřídka nesou jenom malou pragmatickou informaci. K jejich zpracování do zužitkovatelné podoby byly v průběhu let vyvinuty netriviální přístupy, které byly souhrnně začleněny pod hlavičku dolování dat (data mining, DM) popř. objevování dat v databázích (knowledge discovery in databases, KDD). Mezi základní úlohy disciplíny patří vyhledávání netriviálních vzorů, souvislostí či pravidel v datech a jejich přehledné, člověkem pochopitelné prezentování. Tato bakalářská práce se zabývá úpravou klasifikačního algoritmu CN2 pro účely vylepšení jeho predikční přesnosti pro data, u kterých máme tzv. apriorní znalost (background knowledge), tj. předem danou znalost vztahující se k jednotlivým atributům. Touto znalostí může být jako v našem případě například textový popis genu, na jehož základu se dá usuzovat na souvztažnost některých atributů, a na základě této doplňkové znalosti můžeme výběry příslušných atributů do generovaných pravidel motivovat. Od tohoto přístupu si slibujeme vylepšené klasifikační schopnosti nového algoritmu Úvod do genetiky V této části se stručně zmíním o původu dat, nad kterými byly prováděny experimenty. Nejprve bychom si měli vytvořit představu o tom, co to genetická data vlastně jsou: jsou to data týkající se obecně genomu; v našem kontextu jde vždy o data týkající se genomu lidského, takže všechna následující tvrzení o genomu budiž 17

18 chápana v kontextu lidského genomu. Nejjednodušší ještě výstižná představa o genomu by mohla vypadat takto: genom je úplný sada instrukcí kódujících elementární procesy uvnitř lidského těla (včetně jeho vzniku a také regulace procesu vzniku). Obsahuje plány (návrh, design) základního tělesného uspořádání, všech buněčných struktur a nitro buněčných procesů včetně životního cyklu. Lidský genom je zakódovaný v molekulách deoxyribonukleové kyseliny (DNA), které se standardně nacházejí v jádře prakticky všech buněk (kromě bezjaderných červených krvinek), kde spočívají těsně stočené ve šroubovici; spolu s připojenými proteinovými molekulami tvoří organizační jednotku zvanou chromozom. Chromozomů má člověk v každé běžné buňce 46. V následujících odstavcích se stručně zmíním o základním popise a funkci DNA DNA Po chemické stránce je DNA dlouhý polymer skládající se z jednoduchých informaci nesoucích jednotek zvaných nukleotidy navázaných na informaci nenesoucí kostře z cukrů a fosfátů (zbytky po kyselině fosforečné). Ke každému cukru je připojena jedna ze čtyř druhů molekul zvaných báze; těmito bázemi mohou být adenin (A), cytosin (C), guanin (G) a thymin (T). Sekvence těchto bází podél fosfátové kostry molekuly kóduje informaci podobně jako ji kódují dipóly na magnetické pásce. Molekula DNA obsahuje dvě taková vlákna, která jsou k sobě připojena bázemi. Báze se na sebe vážou pomocí vodíkových můstků; vždy adenin s thyminem a cytosin s guaninem; říká se, že jsou tyto báze navzájem komplementární. Tyto báze spolu s cukr fosfátovou kostrou tvoří dvojitou šroubovici (double helix). Přesné pořadí bází 18

19 podél kostry se nazývá DNA sekvence. Tato sekvence přesně obsahuje instrukce pro vznik organizmu se specifickými rysy a též pro všechny jeho vnitřní pochody. Velikost genomu se obvykle vyjadřuje jako počet bázových dvojic. Pro lidský genom se toto číslo pohybuje přibližně na 2, dvojicích, pro srovnání pro genom domácí myši je to asi 2, dvojic, pro rýži asi 0, dvojic. Trojce po sobě následujících bází tvoří tzv. kodón. Vzhledem k tomu, že máme 4 možné báze, máme 4 3 = 64 možných kodónů, označují se postupným zápisem písmen označujících jednotlivé báze (např. AAC, AUG). Tyto kodóny jsou úzce spjaty s tzv. aminokyselinami, do kterých se při procesu předávání informace z DNA (translace) přepisují; těchto aminokyselin máme 20. Některé kodóny mají speciální synchronizační funkci, např. start a stop kodóny vymezující oblast translace (viz dále). Ala A GCU, GCC, GCA, GCG Leu L UUA, UUG, CUU, CUC, CUA, CUG Arg R CGU, CGC, CGA, CGG, AGA, Lys K AAA, AAG AGG Asn N AAU, AAC Met M AUG Asp D GAU, GAC Phe F UUU, UUC Cys C UGU, UGC Pro P CCU, CCC, CCA, CCG Gln Q CAA, CAG Ser S UCU, UCC, UCA, UCG, AGU, AGC Glu E GAA, GAG Thr T ACU, ACC, ACA, ACG Gly G GGU, GGC, GGA, GGG Trp W UGG His H CAU, CAC Tyr Y UAU, UAC Ile I AUU, AUC, AUA Val V GUU, GUC, GUA, GUG Start AUG, GUG Stop UAG, UGA, UAA Tab. 0 Významy kodónů krátká označení aminokyselin a příslušné kodóny 19

20 Z předchozí tabulky (tab. 0) je vidět, že genetický kód je tzv. redundantní či degenerovaný tj. že jedna aminokyselina odpovídá většímu množství kodónů. Z tohoto důvodu není možné z vyrobeného aminokyselinového řetězce zjistit původní podobu genu. Jak již bylo řečeno, DNA je nukleová kyselina, vyskytující se s výjimkou bezjaderných červených krvinek v jádře, která obsahuje genetické instrukce používané při vývoji organismu a při řízení jeho vnitřních procesů. Hlavním úkolem DNA je dlouhodobé uložení této informace. Segmenty DNA, které nesou smysluplnou genetickou informaci se nazývají geny; sem patří i části DNA nesoucí informaci o struktuře nebo mají regulační účel. Na DNA jsou taktéž hluché úseky bez jakéhokoliv známého významu, tzv. junk DNA, která tvoří až 97% lidské DNA. Obr. 1 Struktura DNA 20

21 Obrázek na předchozí straně (obr. 1) jasně zachycuje strukturu DNA: po stranách se ve vertikálním smyslu vine cukr fosfátové vlákno; vprostřed jsou na sebe navázané A T a C G báze. Všimněte si, že báze adenin a thymin jsou navázány pomocí dvou můstků, zatímco cytosin s thyminem váží tři můstky a tedy jsou bezpečně nezaměnitelné. V RNA se místo thyminu používá trojvazný uracil (U). Jak již bylo zmíněno, základní jednotkou genetické informace je gen, který je schopný (resp. podstupuje; podle úhlu pohledu) množení (reprodukce) a změny (mutace). Funkcí je realizace nějakého znaku či vlastnosti, kterou kóduje. V makroskopickém pohledu je sám o sobě víceméně pouze kus informace, která podléhá výběrovým (selektivním; či vývojovým evolučním) tlakům. Není bez zajímavosti, že tzv. emergentní jevy nad pooly různých genů nacházejí uplatnění v jiných části umělé inteligence než kterou se zde zabýváme v genetickém programování, návrhu genetických algoritmů a výzkumu kolektivní inteligence. Dnes víme, že lidský genom obsahuje ne více než genů [1], v době psaná této práce známe s tím, že ještě asi 100 čeká na objevení [2]. Z tohoto lze vypozorovat, že genová hustota, která udává počet genů na bázi (b; popř. mega bázi Mb), je poměrně nízká. Hustota lidského genomu je asi genů na Mb [3]. Prokaryota mají tuto hustotu vyšší než vyšší organizmy Geny Jak si lze odvodit z výše napsaného, každá DNA obsahuje řádově stovky až tisíce genů základních fyzikálních a funkčních jednotek informace. Tato informace je použita při konstrukci proteinů, které se následně zapojují do konstrukce a procesů a reakčních cyklů uvnitř buňky katalyzující proteiny se nazývají enzymy. Geny se velmi liší ve své délce; často se rozprostírají přes tisíce bází. Prostor 21

22 mezi geny, který nenese žádnou informaci a nemá žádnou kódovací funkci zaplňují tzv. introny. Jejich délka se liší a typicky to bývají úseky tisíce bází dlouhé, některé však mohou mít i stovky tisíc bází na délku. Organismy jsou sestaveny prakticky zcela z proteinů. Jsou to velké složité molekuly tvořené z dlouhých řetězců podjednotek aminokyselin. Lidé jich mohou syntetizovat přinejmenším druhů. Proteiny se skládají z 20 druhů aminokyselin o jejichž kódování kodóny jsme se zmiňovali výše. Protein průměrné velikosti (3000bp base pairs párů bází) se tedy bude skládat přibližně z 1000 aminokyselin. Největší proteiny titiny, složky svalové sarkomery se skládají z téměř aminokyselin a mají molekulovou hmotnost téměř 3MDa (megadalton) [4]. Na této úrovni je genetický kód série kodónů určujících, které aminokyseliny na kterém místě budou použity pro vybudování konkrétního proteinu. Toto kódování ovšem neprobíhá přímo. Instrukce kódující protein jsou nejprve přeneseny na tzv. mrna (messenger RNA). RNA (ribonucleic acid; ribonukleová kyselina) je nukleová kyselina velmi podobná DNA ve stavebních kamenech s tím rozdílem, že místo thyminu (T) používá uracil (U) jak jsme již zmínili; důležitější však je, že RNA je jednovláknová. MRNA je tedy speciální druh RNA, který má jediný účel a to nechat do sebe otisknout (trascribe) genetickou informaci a poté ji po přesunu z jádra do cytoplasmy použít na stavbu proteinu (translation). Ta probíhá tak, že se na otištěné kodóny naváží příslušné aminokyseliny, které se zřetězí a vytvoří tak molekulu proteinu. Na obrázku 2 je celý proces názorně zachycen. 22

23 Obr. 2 Proces přepisu genetické informace do proteinů Chromozomy Tři miliardy párů bází jsou organizovány do 23 fyzikálně odlišných jednotek zvaných chromozomové páry. Všechny somatické lidské buňky (všechny s výjimkou pohlavních) obsahují dvě množiny chromozomů (říkáme že jsou diploidní) každá je od jednoho z rodičů, proto páry. Z těchto párů je 22 tzv. autosomů (nesexuálních chromozomů společných pro obě pohlaví) a dále jeden pár pohlavně specifický (chromozomy X a Y). Normální žena má pár chromozomů XX a normální muž má XY. Chromozomy jsou pozorovatelné mikroskopem (po obarvení speciálním barvivem) a lze je rozeznat jasně podle velikosti (největší chromozom č. 1 má cca. 245Mbp, nejmenší č. 21 má oproti tomu jen asi 47Mbp). Jevy a případné změny na úrovní DNA jsou ovšem příliš jemné a vyžadují molekulární analýzu. Tyto jemné DNA abnormality jsou odpovědné za různé dědičné choroby jako je anemie nebo cystická fibrióza nebo mohou mýt predispozicí pro vznik rakoviny popřípadě jiných složitých chorob. Je dobré zmínit, že podle počtu chromozomů nelze usuzovat například na 23

24 vyspělost druhu. Octomilka má 8 chromozomů, morče 16, člověk jak byl řečeno 46, drůbež 78 a motýli v závislosti na druhu až 380. Některé druhy rostlin pak 10, jiné i přes Velká většina genů v těchto organizmech je však soustředěna v několika málo velkých chromozomech; zbytek chromozomů je pak malý nebo vysloveně drobný (rozpadlé chromozomy) Genetická data Sekvenování DNA Sekvenování DNA je prosté určení sekvence nukleotidů uvnitř jednoho DNA řetězce druhý řetězec je jak jsem se již zmínil komplementární a jednoznačně odvoditelný. Sekvenování je tedy proces, kterým se převádí DNA sekvence do podoby dat, se kterými se pak dá pracovat pomocí prostředků na hromadné zpracování dat. Pro princip sekvenování existuje několik základní metody. Jednou z nich je například metoda chemické degradace, další je metoda terminace řetězců, která dnes jednoznačně převládá. Tato metoda používá jednovláknovou DNA jako vzor pro syntézu druhého komplementárního řetězce. Tato syntéza je zprostředkována enzymem polymerázou. Reakce je upravena tak, že v určitých místech (na určitých nukleotidech) dochází v závislosti na sekvenci vzorového vlákna k ukončení (terminaci) syntézy. Vznikají tak nedokončené řetězce komplementárního vlákna různých délek; a tyto délky je možné zjistit pomocí elektroforézy v gelu. Jelikož k ukončení reakce dochází ve chvíli, kdy se ve vzorovém vlákně vyskytne určitý nukleotid, tak délka odpovídá vzdálenosti od začátku vlákna, ve které se objevil tento nukleotid. Získáme tedy dílčí informaci o sekvenci známe pozici prvního výskytu 24

25 daného nukleotidu ve vzorovém vlákně. Syntéza se provádí tak, že se vždy hledají řetězce pro jeden konkrétní nukleotid. Trik této metody spočívá v tom, že se do reakce nepřidává pouze terminační dideoxynukleotid, ale také i normální partnerský deoxynukleotid v poměru 100:1. Další důležitým aspektem je, že reakce nikdy neobsahuje pouze jedno vzorové vlákno, ale velké množství těchto vláken se stejnou sekvencí. Při sekvenování tedy probíhá současně více syntéz nových komplementárních vláken. Vzorová vlákna budou vždy na stejných místech obsahovat např. guaniny, proti kterým bude DNA polymeráza do nového vlákna zařazovat cytosiny, které se budou náhodně vybírat z roztoku. Pokud tedy bude jeden ze sta cytosinů mít podobu terminačního dideoxynukleotidu, dojde k zastavení (terminaci) reakce jen u jednoho ze sta nově syntetizovaných vláken. U ostatních bude zařazen normální cytosin a syntéza tohoto vlákna bude pokračovat dále k dalšímu místu, kde kam bude potřeba na guanin navázat nějaký cytosin. V tomto momentu se opět zastaví 1% z dosud syntetizujících vláken. Na konci tohoto procesu tedy bude výsledkem reakce směs nových vláken, která budou dlouhá v závislosti na tom, kde se u nich syntéza zastavila. Po rozdělení v gelu a zjištění jejich délky v počtu párů tedy zjistíme pozice, na kterých se ve vzoru objevil guanin. Současné metody jsou schopné přímo sekvenovat jenom relativně krátké úseky DNA, nukleotidů; hlavním problémem je, že při dosažení této hranice chybí rozlišovací schopnost od sebe rozeznat dva úseky lišící se v délce o jeden nukleotid. Používaným řešením je, že se DNA (nejdelší chromozom = 250 milionů bází) mechanicky nebo pomocí speciálních enzymů rozstřihne na menší části, které se pak za pomocí vhodné bakterie namnoží (což ovšem nelze úplně vždy mj. kvůli vlivu této DNA na fungování hostitelské bakterie) a potom sekvenují s tím, že se s výhodou využije faktu, že se nová sekvence překrývá se nějakou vhodnou známou částí k přesné identifikaci jejího umístění (shotgun sekvenování). 25

26 Jak jsme již zmínili, lidský genom obsahuje zhruba bází. Při průměrné velikosti sekvenovaného fragmentu 500bp a zanedbání překryvů, je potřeba nejméně běhů k jeho úplnému osekvenování. I přes tuto zjevnou pomalost již v roce 1999 resp byly zveřejněny sekvence chromozomu 22 resp. 21. V současnosti uváděné sekvenční technologie jsou nadto schopny pracovat řádově rychleji než dřívější elektroforézní systémy Genové čipy Jiný přístup jak získat data z DNA je použít tzv. genové čipů, tzv. microarrays. Tato metoda se často se používá pro měření aktivity (exprese) genů v organismu. Vzhledem k tomu, že data zkoumaná v této práci mají původ právě v genových čipech, tuto problematiku zde trochu rozvedeme. Tato metoda je založena na technologii DNA prob; probu si lze představit jako jakousi sondu, sekvenci několika bází, která identifikuje určitý úsek DNA. Postup je následující. Vezmeme jedno vlákno DNA, toto vlákno budiž komplementární doplněk sekvence, kterou chceme hledat. Vložíme ho do ro roztoku, který obsahuje zkoumaný genetický materiál. V případě, že proba nalezne v roztoku svůj komplement, dojde ke spojení proby a tohoto komplementu ze zkoumaného genetického materiálu (tzv. hybridizaci). Trik této metody tkví v tom, že dříve než se zkoumaný genetický materiál (což bývá RNA získaná ze zkoumané DNA) vloží do roztoku, je opatřen fluorescentem. V technologii genetických čipů se tohoto využívá tak, že se proby ve velkém množství zafixují na konkrétní přesně dané pozice na čipu (což je většinou sklíčko nebo jiný speciální povrch), takže podle intenzity zbarvení lze v principu jednoduše určit kam se obarvená RNA uchytává, tj. jaké sekvence obsahuje. Často se toto pak provádí s různě zbarveným materiálem různého původu, takže lze okamžitě srovnat rozdíly ve 26

27 výskytu sekvencí ve vzorcích. Různý původ může například znamenat, že jeden materiál má původ ve zdravých buňkách a druhý v buňkách napadených rakovinou, buňkách na které byly aplikovány léky apod. Jak bylo řečeno, prob může být velké množství a hybridizace probíhá na všech současně, takže technologie dává poměrně rozsáhlé výsledky například pro bakterii E. coli, která je pro jednoduchý genom často vyhledávaným objektem experimentů, se na čip vejde dost prob pro nalezení všech jejích 4000 genů. Dále pak na každý čip je umístěno velké množství prob, které jsou stejné; jelikož ne každý proba je následně hybridizovaná v plné míře (dochází k částečné hybridizaci), je pro přesnější určení přítomnosti dané sondy ve zkoumaném vzorku (samplu) výhodné získané hodnoty tímto způsobem zprůměrovat. Tato data pak naskýtají vhodnou příležitost pro použití strojového učení. Následující obrázek č. 3 ukazuje, jak může genový čip a hybridizační procesy na něm vypadat. Obr. 3 Proces hybridizace na genovém čipu [5] Z obrázku je patrné, že délka RNA řetězců je výrazně větší než délka pro; typická délka v praxi používaných prob je asi 25 bází, oproti tomu typická délka 27

28 zkoumaného samplu je v tisících bází. Tato délka je dostatečná k identifikaci zkoumaných genů a na druhou stranu jsou proby dost krátké na to, aby nedocházelo k nežádoucím hybridizacím, například částečným hybridizacím nebo vzájemným hybridizacím dvou sond popřípadě jakési sebehybridizaci jedné sondy. Dále po ukončení fáze hybridizace je čip opláchnut, aby se smyla všechna nehybridizovaná (obarvená) DNA a pomocí optického mikroskopu se přečte hodnota intenzity fluorescence každého konkrétního vzorku na čipu Genomická data Ve stručnosti o tom, jak jsou nasbíraná data reprezentována a jak je s nimi manipulováno: existuje několik pohledů na to jak organizovat genomická data pro další využití lišící se v tom, co tvoří příklady (examples) a co vlastnosti (features). První možností je, že gen tvoří příklad a jeho exprese v různých podmínkách je množina vlastnosti. Druhý asi přirozenější přístup, který také používáme v této práci, je ten, že příklad je tvořený experimentem a jednotlivé rysy odpovídají jednotlivým genům. V této práci k těmto datům přistupujeme pomocí tzv. metody učení s učitelem; tj. vytvoříme model na trénovacích datech, kde pro každý příklad je přiřazena kategorie (rakovina ano ne, leukémie typ 1 typ 2). Na základě vytvořeného modelu pak jsme schopní rozhodnout pro do příkladů nezahrnuté případy o zařazení do kategorie. Pro experimenty byly použity dva zdroje dat: SAGE data a ALLAML. data. 28

29 SAGE data Serial Analysis of Gene Expression data alias SAGE data jsou microarray data s extrémně vysokou dimenzí a díky metodě měření jsou zde přítomny chyby ve velkém množství. Původním problémem nad těmito daty je správně oklasifikovat typ rakoviny, v našem případě však hledáme pravidla pouze pro třídy rakovina ano/ne. Tento data set má záměrně velmi diverzifikovaný původ (různé tkáně), aby bylo možné provést mezitkáňová srovnání. Pro velkou šíři záběru tyto data asi nemá smysl více rozebírat. Originální dataset obsahuje atributů a počet chyb dosahuje asi 10%[9]. V našem případě jsme však až s takto vysokodimenzionálními daty nepracovali a po redukci atributů na takové, které se projevily alespoň v několika situacích zůstalo asi atributů. Klasifikační přesnost CN2 bez injektové apriorní znalosti se na těchto datech pochybuje kolem 66% ALLAML data ALL vs. AML problém spočívá ve správném klasifikování vzorku s leukémií. Leukémie je jak asi všichni víme, nádorové onemocnění bílých krvinek. Abnormální bílé krvinky se množí na úkor červených krvinek i krevních destiček, čímž vyvolají anémii, krvácení a krevní výrony. V těžkých případech mohou v kostní dřeni úplně potlačit krvetvorbu. Leukémie lze rozdělit podle dvou atributů do čtyř skupin: jednak na akutní a chronické, dále pak na lymfocytické a myeloidní. Akutní leukémie je charakterizovaná rapidním šířením nezralých krevních buněk. Toto zahlcení způsobí, že kostní dřeň je následně neschopná tvořit zralé buňky, 29

30 kterých je pak logicky nedostatek. Tato nemoc je vyskytuje u dětí a dospívajících (v USA v této kategorii je to nejčastější příčina úmrtí mezi zhoubnými onemocněními). Chronická leukémie se liší tím, že kostní dřeň produkuje velké množství relativně vyspělých, ale stále nějak abnormálních buněk. Typicky trvá měsíce až roky než se vyvinou a jsou produkovány v daleko větším počtu než je běžné. Výsledkem je pak velké množství abnormálních bílých krvinek v krvi. Toto onemocnění je naopak časté u starších lidí. Rozdíl mezi lymfocytickou a myeloidní leukémií je v tom, který typ buněk zasahuje zda bílé krvinky (lymphocyty) nebo buňky kostní dřeně (myelocyty). Naučit strojově rozpoznávat a predikovat tento rozdíl je mj. naším úkolem v této práci. Příklady jsou rozděleny do dvou tříd: ALL (Acute Lymphocytic Leukemia) a AML (Acute Myelogenous Leukemia), k dispozici jich máme celkem 72. Každý má 7129 atributů/feature, což jsou numericky vyjádřené exprese genů. Vzhledem k tomu, že data mají poměrně kompaktní původ (jedna série měření zaměřená na jeden problém), jejich klasifikace je při použití např. CN2 poměrně daleko snazší resp. predikční síla větší než klasifikace SAGE dat, i když metoda získání (microarray) je u obou sad dat shodná. Originální neupravená data lze získat na této adrese: bin/cancer/publications/pub_paper.cgi?mode=view&paper_id=43, kde je také jejich popis a popis jejich získání. Klasifikační přesnost CN2 bez injektované apriorní znalosti se na těchto datech pochybuje kolem 87%. 30

31 Genové ontologie V této práci dále používáme genové ontologie, zde si je tedy stručně uvedeme. Gene ontology project (GO) poskytuje slovník vhodně volených termínů pro popis atributů genů a procesů týkajících se genů. GO popisuje tři základní struktury: molekulární funkce (molecular function; MF) biologické procesy (biological processes; BP) buněčné komponenty (cellular components) Molekulární funkce popisují různé aktivity genových produktů na molekulární úrovni; nepopisují ovšem kdy nebo kde se dějí. Biologické procesy popisují sérii prováděných akcí skládající se z více molekulárních funkcí. Buněčná komponenta je součást buňky (organela) nebo skupina genových produktů. V oblasti GO se hlavní úsilí soustředí na vytvoření a udržování GO, dále jejich propojení se spolupracujícími databázemi (DB obsahující data týkající se genomu člověka, zvířat, rostlin, bakterií apod.) a vytvoření nástrojů, které jsou schopné s GO efektivně pracovat nebo vytvářet je. Takováto sjednocená platforma pak umožňuje jednotné dotazování napříč spolupracujícími databázemi. GO výrazy jsou strukturovány tak, že je možné pomocí nich uplatnit různé pohledy na data. Každý genový produkt má alespoň jednu molekulární funkci a je použitý alespoň v jednom biologickém procesu v alespoň jedné buněčné komponentě. GO výrazy jsou organizované v orientovaném acyklickém grafu (directed acyclic graph; DAG). Pro první představu si lze DAGy znázornit jako větvemi propletené orientované stromy rozdíl oproti jednoduchému stromu je ten, že potomek může mít více předků; teorií grafů se zde ovšem nebudeme zabývat, pro případ potřeby či zájmu odkazuji na [10]. V GO platí pravidlo které říká, že pokud nějaký uzel grafu popisuje nějaký genový produkt, pak tento genový produkt musí popisovat i jeho předchůdce. 31

32 GO výrazy v každém případě nejsou úplným popisem celé složité struktury a všech jevů týkajících se genových produktů, umožňují nám přiřadit genům a jejich produktům pouze omezenou množinu atributů. Pomocí GO například není možné popsat v kterých buňkách, jejich vývojových stádiích nebo jakém širším kontextu (například chorob) se projevují tyto popisy jsou součástí jiných ontologií určených pro jiné účely. 32

33 1.3. Klasifikace CN2 Algoritmus CN2 byl uveden v roce 1988 [6], jeho princip je následující: při startu algoritmu máme prázdnou množinu pravidel a dokud existuje prvek v (nějak neurčitě definovanou funkcí určené) množině pravidel s výhodnou hodnotou výběrového kritéria (tj. jsou vhodná pro tvorbu pravidel), pak odstraníme z množiny examplů examply pokryté nejlépe vypadajícím pravidlem, a do množiny pravidel přiřadíme toto pravidlo implikující majoritní třídu těchto examplů. V pseudokódu toto vypadá přibližně následovně (pro uspořádanou variantu): def CN2 ( Examples ): # seznam examplů (n-tic s třídou) je vstupem, tj. schematicky: # Examples = [ [ [ att1... attn ], class ],...,... ] # seznam pravidel je prázdný ListOfRules = empty # získáme nejlepší vhodné pravidlo nebo empty množinu BestRule = GetBestRule(Examples) # dokud není množina examplů prázdná # nebo nejsou žádná vhodná pravidla while ( not Examples.empty() and not BestRule.empty() ): # odstraníme pravidlem pokryté examply E.remove( BestRule.coveredExamples() ) # do seznamu pravidel přidáme na konec pravidlo # indukující majoritní třídů pokrytých examplů ListOfRules.addRuleWithClass( BestRule, BestRule.coveredExamples().getMajorityClass() ) # získáme nejlepší vhodné pravidlo pro další cyklus BestRule = GetBestRule(Examples) 33

34 Je zjevné, že naprosto rozhodující roli na efektivitu algoritmu bude mít kvalita volby funkce GetBestRule. CN2 algoritmus tuto funkci implementuje pomocí paprskového prohledávání tak, že si udržuje množinu (paprsek) nejnadějnějších pravidel a tyto specializuje dokud to je možné a výhodné. Následující obrázek proces názorně ilustruje: TRUE ATT1 op C1 ATT2 op C2 ATTn op Cn ATT2 op C2 and ATT1 op C1 ATT2 op C2 and ATT3 op C3 ATTn op Cn and ATT2 op C2 Obr. 4 Paprskové procházení stavovým prostorem algoritmu CN2 V každém momentu si algoritmus pamatuje jenom určité množství nejnadějnějších pravidel (podle nějaké hodnotící funkce), které odpovídá šířce paprsku. Původní implementace CN2 toto realizuje poměrně zbytečně složitým způsobem tak, že skladuje seznam nadějných pravidel na velikostí omezené haldě a přebývající pravidla tedy přepadnou přes okraj (první myšlenka jak to realizovat, která se sama nabízí a může vás taktéž napadnout, ovšem není zrovna správná). Při defaultně malé šířce paprsku (<10) se ale jinak žádoucí asymptotická výhodnost této metody bezpečně nijak neprojevuje a realizace pomocí pole by mohla být dokonce výrazně výhodnější. Pokud jde o to jak vypadá toto paprskové prohledávání v kódu, pak následuje 34

Populační genetika. ) a. Populační genetika. Castle-Hardy-Weinbergova zákonitost. Platí v panmiktické populaci za předpokladu omezujících podmínek

Populační genetika. ) a. Populační genetika. Castle-Hardy-Weinbergova zákonitost. Platí v panmiktické populaci za předpokladu omezujících podmínek Poulační genetika Poulační genetika ORGANISMUS Součást výše organizované soustavy oulace POPULACE Soubor jedinců jednoho druhu Genotyově heterogenní V určitém čase má řirozeně vymezený rostor Velký očet

Více

Studijní materiály pro bioinformatickou část ViBuChu. úloha II. Jan Komárek, Gabriel Demo

Studijní materiály pro bioinformatickou část ViBuChu. úloha II. Jan Komárek, Gabriel Demo Studijní materiály pro bioinformatickou část ViBuChu úloha II Jan Komárek, Gabriel Demo Adenin Struktura DNA Thymin 5 konec 3 konec DNA tvořena dvěmi řetězci orientovanými antiparalelně (liší se orientací

Více

NUKLEOVÉ KYSELINY. Složení nukleových kyselin. Typy nukleových kyselin:

NUKLEOVÉ KYSELINY. Složení nukleových kyselin. Typy nukleových kyselin: NUKLEOVÉ KYSELINY Deoxyribonukleová kyselina (DNA, odvozeno z anglického názvu deoxyribonucleic acid) Ribonukleová kyselina (RNA, odvozeno z anglického názvu ribonucleic acid) Definice a zařazení: Nukleové

Více

Exprese genetické informace

Exprese genetické informace Exprese genetické informace Stavební kameny nukleových kyselin Nukleotidy = báze + cukr + fosfát BÁZE FOSFÁT Nukleosid = báze + cukr CUKR Báze Cyklické sloučeniny obsahující dusík puriny nebo pyrimidiny

Více

Molekulárn. rní. biologie Struktura DNA a RNA

Molekulárn. rní. biologie Struktura DNA a RNA Molekulárn rní základy dědičnosti Ústřední dogma molekulárn rní biologie Struktura DNA a RNA Ústřední dogma molekulárn rní genetiky - vztah mezi nukleovými kyselinami a proteiny proteosyntéza replikace

Více

Proteiny Genová exprese. 2013 Doc. MVDr. Eva Bártová, Ph.D.

Proteiny Genová exprese. 2013 Doc. MVDr. Eva Bártová, Ph.D. Proteiny Genová exprese 2013 Doc. MVDr. Eva Bártová, Ph.D. Bílkoviny (proteiny), 15% 1g = 17 kj Monomer = aminokyseliny aminová skupina karboxylová skupina α -uhlík postranní řetězec Znát obecný vzorec

Více

Dědičnost x proměnlivost Neboli heredita je schopnost organismů vytvářet potomky se stejnými nebo podobnými znaky. Je to jedna ze základních

Dědičnost x proměnlivost Neboli heredita je schopnost organismů vytvářet potomky se stejnými nebo podobnými znaky. Je to jedna ze základních Mgr. Zbyněk Houdek Doporučenálit.: Alberts, B. a kol.: Základy buněčné biologie (1998) Kočárek, E.: Genetika (2008) Kubišta, V.: Buněčné základy životních dějů (1998) Otová, B. a kol.: Lékařská biologie

Více

-dědičnost= schopnost rodičů předat vlastnosti v podobě vloh potomkům

-dědičnost= schopnost rodičů předat vlastnosti v podobě vloh potomkům Otázka: Molekulární základy dědičnosti Předmět: Biologie Přidal(a): KatkaS GENETIKA =dědičnost, proměnlivost organismu -dědičnost= schopnost rodičů předat vlastnosti v podobě vloh potomkům -umožní zachovat

Více

Schéma průběhu transkripce

Schéma průběhu transkripce Molekulární základy genetiky PROTEOSYNTÉZA A GENETICKÝ KÓD Proteosyntéza je složitý proces tvorby bílkovin, který zahrnuje proces přepisu genetické informace z DNA do kratšího zápisu v informační mrna

Více

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY

Více

Inovace studia molekulární a buněčné biologie

Inovace studia molekulární a buněčné biologie Inovace studia molekulární a buněčné biologie Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. MBIO1/Molekulární biologie 1 Tento projekt je spolufinancován

Více

Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled

Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled Bioinformatika a výpočetní biologie KFC/BIN I. Přehled RNDr. Karel Berka, Ph.D. Univerzita Palackého v Olomouci Definice bioinformatiky (Molecular) bio informatics: bioinformatics is conceptualising biology

Více

Centrální dogma molekulární biologie

Centrální dogma molekulární biologie řípravný kurz LF MU 2011/12 Centrální dogma molekulární biologie Nukleové kyseliny 1865 zákony dědičnosti (Johann Gregor Mendel) 1869 objev nukleových kyselin (Miescher) 1944 genetická informace v nukleových

Více

Algoritmy I, složitost

Algoritmy I, složitost A0B36PRI - PROGRAMOVÁNÍ Algoritmy I, složitost České vysoké učení technické Fakulta elektrotechnická v 1.01 Rychlost... Jeden algoritmus (program, postup, metoda ) je rychlejší než druhý. Co ta věta znamená??

Více

Genomické databáze. Shlukování proteinových sekvencí. Ivana Rudolfová. školitel: doc. Ing. Jaroslav Zendulka, CSc.

Genomické databáze. Shlukování proteinových sekvencí. Ivana Rudolfová. školitel: doc. Ing. Jaroslav Zendulka, CSc. Genomické databáze Shlukování proteinových sekvencí Ivana Rudolfová školitel: doc. Ing. Jaroslav Zendulka, CSc. Obsah Proteiny Zdroje dat Predikce struktury proteinů Cíle disertační práce Vstupní data

Více

Nukleové kyseliny příručka pro učitele. Obecné informace:

Nukleové kyseliny příručka pro učitele. Obecné informace: Obecné informace: Nukleové kyseliny příručka pro učitele Téma Nukleové kyseliny je završením základních kapitol z popisné chemie a je tedy zařazeno až na její závěr. Probírá se v rámci jedné, eventuálně

Více

Molekulární genetika. DNA = deoxyribonukleová kyselina. RNA = ribonukleová kyselina

Molekulární genetika. DNA = deoxyribonukleová kyselina. RNA = ribonukleová kyselina Přehled GMH Seminář z biologie GENETIKA Molekulární genetika Základní dogma molekulární biologie Základním nosičem genetické informace je molekula DNA. Tato molekula se může replikovat (kopírovat). Informace

Více

Úloha protein-nekódujících transkriptů ve virulenci patogenních bakterií

Úloha protein-nekódujících transkriptů ve virulenci patogenních bakterií Téma bakalářské práce: Úloha protein-nekódujících transkriptů ve virulenci patogenních bakterií Nové odvětví molekulární biologie se zabývá RNA molekulami, které se nepřekládají do proteinů, ale slouží

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

6. Nukleové kyseliny

6. Nukleové kyseliny 6. ukleové kyseliny ukleové kyseliny jsou spolu s proteiny základní a nezbytnou složkou živé hmoty. lavní jejich funkce je uchování genetické informace a její přenos do dceřinné buňky. ukleové kyseliny

Více

Genetika. Genetika. Nauka o dědid. dičnosti a proměnlivosti. molekulárn. rní buněk organismů populací

Genetika. Genetika. Nauka o dědid. dičnosti a proměnlivosti. molekulárn. rní buněk organismů populací Genetika Nauka o dědid dičnosti a proměnlivosti Genetika molekulárn rní buněk organismů populací Dědičnost na úrovni nukleových kyselin Předávání vloh z buňky na buňku Předávání vlastností mezi jednotlivci

Více

DNA TECHNIKY IDENTIFIKACE ŽIVOČIŠNÝCH DRUHŮ V KRMIVU A POTRAVINÁCH. Michaela Nesvadbová

DNA TECHNIKY IDENTIFIKACE ŽIVOČIŠNÝCH DRUHŮ V KRMIVU A POTRAVINÁCH. Michaela Nesvadbová DNA TECHNIKY IDENTIFIKACE ŽIVOČIŠNÝCH DRUHŮ V KRMIVU A POTRAVINÁCH Michaela Nesvadbová Význam identifikace živočišných druhů v krmivu a potravinách povinností každého výrobce je řádně a pravdivě označit

Více

USING OF AUTOMATED DNA SEQUENCING FOR PORCINE CANDIDATE GENES POLYMORFISMS DETECTION

USING OF AUTOMATED DNA SEQUENCING FOR PORCINE CANDIDATE GENES POLYMORFISMS DETECTION USING OF AUTOMATED DNA SEQUENCING FOR PORCINE CANDIDATE GENES POLYMORFISMS DETECTION VYUŽITÍ AUTOMATICKÉHO SEKVENOVÁNÍ DNA PRO DETEKCI POLYMORFISMŮ KANDIDÁTNÍCH GENŮ U PRASAT Vykoukalová Z., Knoll A.,

Více

Molekulární základ dědičnosti

Molekulární základ dědičnosti Molekulární základ dědičnosti Dědičná informace je zakódována v deoxyribonukleové kyselině, která je uložena v jádře buňky v chromozómech. Zlomovým objevem pro další rozvoj molekulární genetiky bylo odhalení

Více

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti URČOVÁNÍ PRIMÁRNÍ STRUKTURY BÍLKOVIN

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti URČOVÁNÍ PRIMÁRNÍ STRUKTURY BÍLKOVIN Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti URČOVÁNÍ PRIMÁRNÍ STRUKTURY BÍLKOVIN Primární struktura primární struktura bílkoviny je dána pořadím AK jejích polypeptidových řetězců

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FRAKTÁL V SEKVENCI DNA BAKALÁŘSKÁ PRÁCE FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV RADIOELEKTRONIKY

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FRAKTÁL V SEKVENCI DNA BAKALÁŘSKÁ PRÁCE FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV RADIOELEKTRONIKY VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV RADIOELEKTRONIKY FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT OF

Více

Projekt realizovaný na SPŠ Nové Město nad Metují

Projekt realizovaný na SPŠ Nové Město nad Metují Projekt realizovaný na SPŠ Nové Město nad Metují s finanční podporou v Operačním programu Vzdělávání pro konkurenceschopnost Královéhradeckého kraje Modul 02 Přírodovědné předměty Hana Gajdušková 1 Viry

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

Aminokyseliny příručka pro učitele. Obecné informace: Téma otevírá kapitolu Bílkoviny, která svým rozsahem překračuje rámec jedné vyučovací hodiny.

Aminokyseliny příručka pro učitele. Obecné informace: Téma otevírá kapitolu Bílkoviny, která svým rozsahem překračuje rámec jedné vyučovací hodiny. Obecné informace: Aminokyseliny příručka pro učitele Téma otevírá kapitolu Bílkoviny, která svým rozsahem překračuje rámec jedné vyučovací hodiny. Navazující učivo Před probráním tématu Aminokyseliny probereme

Více

6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života?

6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života? 6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života? Pamatujete na to, co se objevilo v pracích Charlese Darwina a Alfreda Wallace ohledně vývoje druhů? Aby mohl mechanismus přírodního

Více

ENZYMY A NUKLEOVÉ KYSELINY

ENZYMY A NUKLEOVÉ KYSELINY ENZYMY A NUKLEOVÉ KYSELINY Autor: Mgr. Stanislava Bubíková Datum (období) tvorby: 28. 3. 2013 Ročník: devátý Vzdělávací oblast: Člověk a příroda / Chemie / Organické sloučeniny 1 Anotace: Žáci se seznámí

Více

Využití metagenomiky při hodnocení sanace chlorovaných ethylenů in situ Výsledky pilotních testů

Využití metagenomiky při hodnocení sanace chlorovaných ethylenů in situ Výsledky pilotních testů Využití metagenomiky při hodnocení sanace chlorovaných ethylenů in situ Výsledky pilotních testů Stavělová M.,* Macháčková J.*, Rídl J.,** Pačes J.** * Earth Tech CZ, s.r.o ** ÚMG AV ČR PROČ METAGENOMIKA?

Více

AUG STOP AAAA S S. eukaryontní gen v genomové DNA. promotor exon 1 exon 2 exon 3 exon 4. kódující oblast. introny

AUG STOP AAAA S S. eukaryontní gen v genomové DNA. promotor exon 1 exon 2 exon 3 exon 4. kódující oblast. introny eukaryontní gen v genomové DNA promotor exon 1 exon 2 exon 3 exon 4 kódující oblast introny primární transkript (hnrna, pre-mrna) postranskripční úpravy (vznik maturované mrna) syntéza čepičky AUG vyštěpení

Více

Těsně před infarktem. Jak předpovědět infarkt pomocí informatických metod. Jan Kalina, Marie Tomečková

Těsně před infarktem. Jak předpovědět infarkt pomocí informatických metod. Jan Kalina, Marie Tomečková Těsně před infarktem Jak předpovědět infarkt pomocí informatických metod Jan Kalina, Marie Tomečková Program, osnova sdělení 13,30 Úvod 13,35 Stručně o ateroskleróze 14,15 Měření genových expresí 14,00

Více

Static Load Balancing Applied to Time Dependent Mechanical Problems

Static Load Balancing Applied to Time Dependent Mechanical Problems Static Load Balancing Applied to Time Dependent Mechanical Problems O. Medek 1, J. Kruis 2, Z. Bittnar 2, P. Tvrdík 1 1 Katedra počítačů České vysoké učení technické, Praha 2 Katedra stavební mechaniky

Více

OBSAH 1 ÚVOD... 7. 1.1 Výrobek a materiál... 7 1.2 Přehled a klasifikace materiálů pro výrobu... 8 2 ZDROJE DŘEVA... 13

OBSAH 1 ÚVOD... 7. 1.1 Výrobek a materiál... 7 1.2 Přehled a klasifikace materiálů pro výrobu... 8 2 ZDROJE DŘEVA... 13 OBSAH 1 ÚVOD................................................. 7 1.1 Výrobek a materiál........................................ 7 1.2 Přehled a klasifikace materiálů pro výrobu..................... 8 2

Více

Matematické modelování dopravního proudu

Matematické modelování dopravního proudu Matematické modelování dopravního proudu Ondřej Lanč, Alena Girglová, Kateřina Papežová, Lucie Obšilová Gymnázium Otokara Březiny a SOŠ Telč lancondrej@centrum.cz Abstrakt: Cílem projektu bylo seznámení

Více

Stromy, haldy, prioritní fronty

Stromy, haldy, prioritní fronty Stromy, haldy, prioritní fronty prof. Ing. Pavel Tvrdík CSc. Katedra počítačů FEL České vysoké učení technické DSA, ZS 2008/9, Přednáška 6 http://service.felk.cvut.cz/courses/x36dsa/ prof. Pavel Tvrdík

Více

Obecná biologie a genetika B53 volitelný předmět pro 4. ročník

Obecná biologie a genetika B53 volitelný předmět pro 4. ročník Obecná biologie a genetika B53 volitelný předmět pro 4. ročník Charakteristika vyučovacího předmětu Vyučovací předmět vychází ze vzdělávací oblasti Člověk a příroda, vzdělávacího oboru Biologie. Mezipředmětové

Více

Nukleové kyseliny. Nukleové kyseliny. Genetická informace. Gen a genom. Složení nukleových kyselin. Centrální dogma molekulární biologie

Nukleové kyseliny. Nukleové kyseliny. Genetická informace. Gen a genom. Složení nukleových kyselin. Centrální dogma molekulární biologie Centrální dogma molekulární biologie ukleové kyseliny 1865 zákony dědičnosti (Johann Gregor Transkripce D R Translace rotein Mendel) Replikace 1869 objev nukleových kyselin (Miescher) 1944 nukleové kyseliny

Více

3. úloha - problém batohu metodami branch & bound, dynamické programování, heuristika s testem

3. úloha - problém batohu metodami branch & bound, dynamické programování, heuristika s testem ČVUT FEL X36PAA - Problémy a algoritmy 3. úloha - problém batohu metodami branch & bound, dynamické programování, heuristika s testem Jméno: Marek Handl Datum: 1. 1. 2009 Cvičení: Pondělí 9:00 Zadání Naprogramujte

Více

Moderní systémy pro získávání znalostí z informací a dat

Moderní systémy pro získávání znalostí z informací a dat Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:

Více

Genetická diverzita masného skotu v ČR

Genetická diverzita masného skotu v ČR Genetická diverzita masného skotu v ČR Mgr. Jan Říha Výzkumný ústav pro chov skotu, s.r.o. Ing. Irena Vrtková 26. listopadu 2009 Genetická diverzita skotu pojem diverzity Genom skotu 30 chromozomu, genetická

Více

Degenerace genetického kódu

Degenerace genetického kódu AJ: degeneracy x degeneration CJ: degenerace x degenerace Degenerace genetického kódu Genetický kód je degenerovaný, resp. redundantní, což znamená, že dva či více kodonů může kódovat jednu a tutéž aminokyselinu.

Více

Výuka genetiky na Přírodovědecké fakultě UK v Praze

Výuka genetiky na Přírodovědecké fakultě UK v Praze Výuka genetiky na Přírodovědecké fakultě UK v Praze Studium biologie na PřF UK v Praze Bakalářské studijní programy / obory Biologie Biologie ( duhový bakalář ) Ekologická a evoluční biologie ( zelený

Více

Genetický polymorfismus

Genetický polymorfismus Genetický polymorfismus Za geneticky polymorfní je považován znak s nejméně dvěma geneticky podmíněnými variantami v jedné populaci, které se nachází v takových frekvencích, že i zřídkavá má frekvenci

Více

ČVUT FEL X36PAA - Problémy a algoritmy. 4. úloha - Experimentální hodnocení algoritmů pro řešení problému batohu

ČVUT FEL X36PAA - Problémy a algoritmy. 4. úloha - Experimentální hodnocení algoritmů pro řešení problému batohu ČVUT FEL X36PAA - Problémy a algoritmy 4. úloha - Experimentální hodnocení algoritmů pro řešení problému batohu Jméno: Marek Handl Datum: 3. 2. 29 Cvičení: Pondělí 9: Zadání Prozkoumejte citlivost metod

Více

Klasifikace předmětů a jevů

Klasifikace předmětů a jevů Klasifikace předmětů a jevů 1. Úvod Rozpoznávání neboli klasifikace je základní znak lidské činnosti. Rozpoznávání (klasifikace) předmětů a jevů spočívá v jejich zařazování do jednotlivých tříd. Třídou

Více

Inovace studia molekulární a buněčné biologie

Inovace studia molekulární a buněčné biologie Inovace studia molekulární a buněčné biologie Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. MBIO1/Molekulární biologie 1 Tento projekt je spolufinancován

Více

Metabolismus bílkovin. Václav Pelouch

Metabolismus bílkovin. Václav Pelouch ZÁKLADY OBECNÉ A KLINICKÉ BIOCHEMIE 2004 Metabolismus bílkovin Václav Pelouch kapitola ve skriptech - 3.2 Výživa Vyvážená strava člověka musí obsahovat: cukry (50 55 %) tuky (30 %) bílkoviny (15 20 %)

Více

DUM č. 3 v sadě. 37. Bi-2 Cytologie, molekulární biologie a genetika

DUM č. 3 v sadě. 37. Bi-2 Cytologie, molekulární biologie a genetika projekt GML Brno Docens DUM č. 3 v sadě 37. Bi-2 Cytologie, molekulární biologie a genetika Autor: Martin Krejčí Datum: 02.06.2014 Ročník: 6AF, 6BF Anotace DUMu: chromatin - stavba, organizace a struktura

Více

Aplikace pro srovna ní cen povinne ho ruc ení

Aplikace pro srovna ní cen povinne ho ruc ení Aplikace pro srovna ní cen povinne ho ruc ení Ukázkový přiklad mikroaplikace systému Formcrates 2010 Naucrates s.r.o. Veškerá práva vyhrazena. Vyskočilova 741/3, 140 00 Praha 4 Czech Republic tel.: +420

Více

VY_32_INOVACE_11.18 1/6 3.2.11.18 Genetika Genetika

VY_32_INOVACE_11.18 1/6 3.2.11.18 Genetika Genetika 1/6 3.2.11.18 Cíl chápat pojmy dědičnost, proměnlivost, gen, DNA, dominantní, recesivní, aleoly - vnímat význam vědního oboru - odvodit jeho využití, ale i zneužití Tajemství genů - dědičnost schopnost

Více

Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto

Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Registrační číslo projektu Šablona Autor Název materiálu CZ.1.07/1.5.00/34.0951 III/2 INOVACE A ZKVALITNĚNÍ VÝUKY PROSTŘEDNICTVÍM ICT Mgr. Jana

Více

zejména Dijkstrův algoritmus pro hledání minimální cesty a hladový algoritmus pro hledání minimální kostry.

zejména Dijkstrův algoritmus pro hledání minimální cesty a hladový algoritmus pro hledání minimální kostry. Kapitola Ohodnocené grafy V praktických aplikacích teorie grafů zpravidla graf slouží jako nástroj k popisu nějaké struktury. Jednotlivé prvky této struktury mají často přiřazeny nějaké hodnoty (může jít

Více

Daniel Beneš Slezská univerzita v Opavě Filozoficko-přírodovědecká fakulta Ústav informatiky

Daniel Beneš Slezská univerzita v Opavě Filozoficko-přírodovědecká fakulta Ústav informatiky Daniel Beneš Slezská univerzita v Opavě Filozoficko-přírodovědecká fakulta Ústav informatiky Charakteristika projektu On-line aplikace pro analýzu mikrosatelitů révy vinné Charakteristika projektu On-line

Více

2. úkol MI-PAA. Jan Jůna (junajan) 3.11.2013

2. úkol MI-PAA. Jan Jůna (junajan) 3.11.2013 2. úkol MI-PAA Jan Jůna (junajan) 3.11.2013 Specifikaci úlohy Problém batohu je jedním z nejjednodušších NP-těžkých problémů. V literatuře najdeme množství jeho variant, které mají obecně různé nároky

Více

FORTANNS. havlicekv@fzp.czu.cz 22. února 2010

FORTANNS. havlicekv@fzp.czu.cz 22. února 2010 FORTANNS manuál Vojtěch Havlíček havlicekv@fzp.czu.cz 22. února 2010 1 Úvod Program FORTANNS je software určený k modelování časových řad. Kód programu má 1800 řádek a je napsán v programovacím jazyku

Více

Dědičnost vázaná na X chromosom

Dědičnost vázaná na X chromosom 12 Dědičnost vázaná na X chromosom EuroGentest - Volně přístupné webové stránky s informacemi o genetickém vyšetření (v angličtině). www.eurogentest.org Orphanet - Volně přístupné webové stránky s informacemi

Více

Výhody a nevýhody jednotlivých reprezentací jsou shrnuty na konci kapitoly.

Výhody a nevýhody jednotlivých reprezentací jsou shrnuty na konci kapitoly. Kapitola Reprezentace grafu V kapitole?? jsme se dozvěděli, co to jsou grafy a k čemu jsou dobré. rzo budeme chtít napsat nějaký program, který s grafy pracuje. le jak si takový graf uložit do počítače?

Více

Gymnázium a Střední odborná škola pedagogická, Čáslav, Masarykova 248

Gymnázium a Střední odborná škola pedagogická, Čáslav, Masarykova 248 Gymnázium a Střední odborná škola pedagogická, Čáslav, Masarykova 248 M o d e r n í b i o l o g i e reg. č.: CZ.1.07/1.1.32/02.0048 TENTO PROJEKT JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM A STÁTNÍM

Více

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ

Více

Buňka. základní stavební jednotka organismů

Buňka. základní stavební jednotka organismů Buňka základní stavební jednotka organismů Buňka Buňka je základní stavební a funkční jednotka těl organizmů. Toto se netýká virů (z lat. virus jed, je drobný vnitrobuněčný cizopasník nacházející se na

Více

Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš

Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš KVANTOVÁNÍ ZVUKOVÝCH SIGNÁLŮ NÍZKÉ ÚROVNĚ Abstrakt Quantization of acoustic low level signals David Bursík, Miroslav Lukeš Při testování kvality A/D převodníků se používají nejrůznější testovací signály.

Více

Identifikace. Jiří Jelínek. Katedra managementu informací Fakulta managementu J. Hradec Vysoká škola ekonomická Praha

Identifikace. Jiří Jelínek. Katedra managementu informací Fakulta managementu J. Hradec Vysoká škola ekonomická Praha Identifikace tématických sociálních sítí Katedra managementu informací Fakulta managementu J. Hradec Vysoká škola ekonomická Praha 2 Obsah prezentace Cíl Fáze řešení a navržené postupy Prototyp a výsledky

Více

Jsme tak odlišní. Co nás spojuje..? Nukleové kyseliny

Jsme tak odlišní. Co nás spojuje..? Nukleové kyseliny Jsme tak odlišní Co nás spojuje..? ukleové kyseliny 1 UKLEVÉ KYSELIY = K anj = A ositelky genetických informací Základní význam pro všechny organismy V buňkách a virech Identifikace v buněčném jádře (nucleos)

Více

DOKUMENTACE Identifikace pomocí otisků prstů

DOKUMENTACE Identifikace pomocí otisků prstů DOKUMENTACE Identifikace pomocí otisků prstů Lukáš Rajský, RAJ029 Aleš Seifert, SEI041 1. února 2003 1 1 Úvod První známý systém klasifikace otisku prstů byl zaveden v Indii na počátku minulého století

Více

Standardní algoritmy vyhledávací.

Standardní algoritmy vyhledávací. Standardní algoritmy vyhledávací. Vyhledávací algoritmy v C++ nám umožňují vyhledávat prvky v datových kontejnerech podle různých kritérií. Také se podíváme na vyhledávání metodou půlením intervalu (binární

Více

Radiační patofyziologie. Zdroje záření. Typy ionizujícího záření: Jednotky pro měření radiace:

Radiační patofyziologie. Zdroje záření. Typy ionizujícího záření: Jednotky pro měření radiace: Radiační patofyziologie Radiační poškození vzniká účinkem ionizujícího záření. Co se týká jeho původu, ionizující záření vzniká: při radioaktivním rozpadu prvků, přichází z kosmického prostoru, je produkováno

Více

4. Centrální dogma, rozluštění genetického kódu a zrod molekulární biologie.

4. Centrální dogma, rozluštění genetického kódu a zrod molekulární biologie. 4. Centrální dogma, rozluštění genetického kódu a zrod molekulární biologie. Od genu k proteinu - centrální dogma biologie Geny jsou zakódovány v DNA - Jakým způsobem? - Jak se projevují? Již v roce 1902

Více

Instrukce pro vzdálené připojení do učebny 39d

Instrukce pro vzdálené připojení do učebny 39d Instrukce pro vzdálené připojení do učebny 39d Každá skupina má k dispozici jedno sdílené připojení, prostřednictvím kterého se může vzdáleně připojit do učebny 39d a pracovat na svých semestrálních projektech

Více

Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto

Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Registrační číslo projektu Šablona Autor Název materiálu / Druh CZ.1.07/1.5.00/34.0951 III/2 INOVACE A ZKVALITNĚNÍ VÝUKY PROSTŘEDNICTVÍM ICT

Více

Digitální učební materiál

Digitální učební materiál Digitální učební materiál Projekt CZ.1.07/1.5.00/34.0415 Inovujeme, inovujeme Šablona III/2 Inovace a zkvalitnění výuky prostřednictvím ICT (DUM) Tematická Odborná biologie, část biologie Společná pro

Více

Doprovodný materiál k práci s přípravným textem Biologické olympiády 2014/2015 pro soutěžící a organizátory kategorie B

Doprovodný materiál k práci s přípravným textem Biologické olympiády 2014/2015 pro soutěžící a organizátory kategorie B Doprovodný materiál k práci s přípravným textem Biologické olympiády 2014/2015 pro soutěžící a organizátory kategorie B Níže uvedené komentáře by měly pomoci soutěžícím z kategorie B ke snazší orientaci

Více

Kde se NK vyskytují?

Kde se NK vyskytují? ukleové kyseliny Kde se K vyskytují? Struktura ukleotid H 2 - H báze Zbytek kyseliny fosforečné H Cukerná složka H H H H H H H H H H H ribosa β-d-ribofuranosa H H H H H H H H H H deoxyribosa 2-deoxy-β-D-ribofuranosa

Více

Stavba dřeva. Základy cytologie. přednáška

Stavba dřeva. Základy cytologie. přednáška Základy cytologie přednáška Buňka definice, charakteristika strana 2 2 Buňky základní strukturální a funkční jednotky živých organismů Základní charakteristiky buněk rozmanitost (diverzita) - např. rostlinná

Více

Výčtový typ strana 67

Výčtový typ strana 67 Výčtový typ strana 67 8. Výčtový typ V této kapitole si ukážeme, jak implementovat v Javě statické seznamy konstant (hodnot). Příkladem mohou být dny v týdnu, měsíce v roce, planety obíhající kolem slunce

Více

CLP ANALYSIS OF MOLECULAR MARKERS DIGITAL IMAGE ANALYSIS OF ELECTROPHOEROGRAMS CZECH VERSION

CLP ANALYSIS OF MOLECULAR MARKERS DIGITAL IMAGE ANALYSIS OF ELECTROPHOEROGRAMS CZECH VERSION CLP ANALYSIS OF MOLECULAR MARKERS DIGITAL IMAGE ANALYSIS OF ELECTROPHOEROGRAMS CZECH VERSION DIGITÁLNÍ OBRAZOVÁ ANALÝZA ELEKTROFORETICKÝCH GELŮ *** Vyhodnocování získaných elektroforeogramů: Pro vyhodnocování

Více

Práce se styly 1. Styl

Práce se styly 1. Styl Práce se styly 1. Styl Styl se používá, pokud chceme, aby dokument měl jednotný vzhled odstavců. Můžeme si nadefinovat styly pro různé úrovně nadpisů, jednotlivé popisy, charakteristiky a další odstavce.

Více

Tvar dat a nástroj přeskupování

Tvar dat a nástroj přeskupování StatSoft Tvar dat a nástroj přeskupování Chtěli jste někdy použít data v jistém tvaru a STATISTICA Vám to nedovolila? Jistě se najde někdo, kdo se v této situaci již ocitl. Není ale potřeba propadat panice,

Více

Architektury počítačů a procesorů

Architektury počítačů a procesorů Kapitola 3 Architektury počítačů a procesorů 3.1 Von Neumannova (a harvardská) architektura Von Neumann 1. počítač se skládá z funkčních jednotek - paměť, řadič, aritmetická jednotka, vstupní a výstupní

Více

DRG systém klasifikuje případy akutní hospitalizační péče do DRG skupin DRG skupiny = nákladově homogenní a klinicky příbuzné skupiny případů

DRG systém klasifikuje případy akutní hospitalizační péče do DRG skupin DRG skupiny = nákladově homogenní a klinicky příbuzné skupiny případů AGENDA Definice kvality DRG systému Statistické metody hodnocení kvality DRG klasifikace Identifikace nenáhodného rozložení případů Využití regresní analýzy nákladů při hledání důvodů v rozdílných nákladech

Více

Metodické pokyny pro práci s modulem Řešitel v tabulkovém procesoru Excel

Metodické pokyny pro práci s modulem Řešitel v tabulkovém procesoru Excel Metodické pokyny pro práci s modulem Řešitel v tabulkovém procesoru Excel Modul Řešitel (v anglické verzi Solver) je určen pro řešení lineárních i nelineárních úloh matematického programování. Pro ilustraci

Více

Metabolismus aminokyselin. Vladimíra Kvasnicová

Metabolismus aminokyselin. Vladimíra Kvasnicová Metabolismus aminokyselin Vladimíra Kvasnicová Aminokyseliny aminokyseliny přijímáme v potravě ve formě proteinů: důležitá forma organicky vázaného dusíku, který tak může být v těle využit k syntéze dalších

Více

APLIKACE METAGENOMIKY PRO HODNOCENÍ PRŮBĚHU SANAČNÍHO ZÁSAHU NA LOKALITÁCH KONTAMINOVANÝCH CHLOROVANÝMI ETHYLÉNY

APLIKACE METAGENOMIKY PRO HODNOCENÍ PRŮBĚHU SANAČNÍHO ZÁSAHU NA LOKALITÁCH KONTAMINOVANÝCH CHLOROVANÝMI ETHYLÉNY APLIKACE METAGENOMIKY PRO HODNOCENÍ PRŮBĚHU SANAČNÍHO ZÁSAHU NA LOKALITÁCH KONTAMINOVANÝCH CHLOROVANÝMI ETHYLÉNY Monika Stavělová 1, Jakub Rídl 2, Maria Brennerová 3, Hana Kosinová 1, Jan Pačes 2 1 AECOM

Více

Příloha č. 1 k Vyhláška rektora č. 01/2011 o bakalářských pracích

Příloha č. 1 k Vyhláška rektora č. 01/2011 o bakalářských pracích Příloha č. 1 k Vyhláška rektora č. 01/2011 o bakalářských pracích Struktura písemné práce Z formálního hlediska by bakalářská práce měla splňovat požadavky kladené na psaní odborných publikací, tzn. přehlednost,

Více

Testování prvočíselnosti

Testování prvočíselnosti Dokumentace zápočtového programu z Programování II (NPRG031) Testování prvočíselnosti David Pěgřímek http://davpe.net Úvodem V různých oborech (například v kryptografii) je potřeba zjistit, zda je číslo

Více

PHP tutoriál (základy PHP snadno a rychle)

PHP tutoriál (základy PHP snadno a rychle) PHP tutoriál (základy PHP snadno a rychle) Druhá, vylepšená offline verze. Připravil Štěpán Mátl, http://khamos.wz.cz Chceš se naučit základy PHP? V tom případě si prostuduj tento rychlý průvodce. Nejdříve

Více

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a datových modelů Obsah Seznam tabulek... 1 Seznam obrázků... 1 1 Úvod... 2 2 Metody sémantické harmonizace... 2 3 Dvojjazyčné katalogy objektů

Více

Výsledky základní statistické charakteristiky

Výsledky základní statistické charakteristiky Výsledky základní statistické charakteristiky (viz - Vyhláška č. 343/2002 Sb. o průběhu přijímacího řízení na vysokých školách a Vyhláška 276/2004 Sb. kterou se mění vyhláška č. 343/2002 Sb., o postupu

Více

Inovace tohoto kurzu byla spolufinancována z Evropského sociálního fondu a státního rozpočtu České republiky.

Inovace tohoto kurzu byla spolufinancována z Evropského sociálního fondu a státního rozpočtu České republiky. Inovace tohoto kurzu byla spolufinancována z Evropského sociálního fondu a státního rozpočtu České republiky. Projekt ESF OP VK reg.č. CZ.1.07/2.2.00/28.0209 Elektronické opory a e-learning pro obory výpočtového

Více

Nový způsob práce s průběžnou klasifikací lze nastavit pouze tehdy, je-li průběžná klasifikace v evidenčním pololetí a školním roce prázdná.

Nový způsob práce s průběžnou klasifikací lze nastavit pouze tehdy, je-li průběžná klasifikace v evidenčním pololetí a školním roce prázdná. Průběžná klasifikace Nová verze modulu Klasifikace žáků přináší novinky především v práci s průběžnou klasifikací. Pro zadání průběžné klasifikace ve třídě doposud existovaly 3 funkce Průběžná klasifikace,

Více

Využití OOP v praxi -- Knihovna PHP -- Interval.cz

Využití OOP v praxi -- Knihovna PHP -- Interval.cz Page 1 of 6 Knihovna PHP Využití OOP v praxi Po dlouhé teorii přichází na řadu praxe. V následujícím textu si vysvětlíme možnosti přístupu k databázi pomocí různých vzorů objektově orientovaného programování

Více

Dědičnost pohlaví Genetické principy základních způsobů rozmnožování

Dědičnost pohlaví Genetické principy základních způsobů rozmnožování Dědičnost pohlaví Vznik pohlaví (pohlavnost), tj. komplexu znaků, vlastností a funkcí, které vymezují exteriérové i funkční diference mezi příslušníky téhož druhu, je výsledkem velmi komplikované série

Více

Obr. P1.1 Zadání úlohy v MS Excel

Obr. P1.1 Zadání úlohy v MS Excel Přílohy Příloha 1 Řešení úlohy lineárního programování v MS Excel V této příloze si ukážeme, jak lze řešit úlohy lineárního programování pomocí tabulkového procesoru MS Excel. Výpočet budeme demonstrovat

Více

11 Analýza hlavních komponet

11 Analýza hlavních komponet 11 Analýza hlavních komponet Tato úloha provádí transformaci měřených dat na menší počet tzv. fiktivních dat tak, aby většina informace obsažená v původních datech zůstala zachována. Jedná se tedy o úlohu

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

2 PŘÍKLAD IMPORTU ZATÍŽENÍ Z XML

2 PŘÍKLAD IMPORTU ZATÍŽENÍ Z XML ROZHRANÍ ESA XML Ing. Richard Vondráček SCIA CZ, s. r. o., Thákurova 3, 160 00 Praha 6 www.scia.cz 1 OTEVŘENÝ FORMÁT Jednou z mnoha užitečných vlastností programu ESA PT je podpora otevřeného rozhraní

Více

Metabolismus aminokyselin 2. Vladimíra Kvasnicová

Metabolismus aminokyselin 2. Vladimíra Kvasnicová Metabolismus aminokyselin 2 Vladimíra Kvasnicová Odbourávání AMK 1) odstranění aminodusíku z molekuly AMK 2) detoxikace uvolněné aminoskupiny 3) metabolismus uhlíkaté kostry AMK 7 produktů 7 degradačních

Více

Využití strojového učení k identifikaci protein-ligand aktivních míst

Využití strojového učení k identifikaci protein-ligand aktivních míst Využití strojového učení k identifikaci protein-ligand aktivních míst David Hoksza, Radoslav Krivák SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita

Více