Vytváření fylogenetických stromů na základě alignmentů. Tomáš Novotný Jaroslav Knotek
|
|
- Květa Kučerová
- před 6 lety
- Počet zobrazení:
Transkript
1 Vytváření fylogenetických stromů na základě alignmentů Tomáš Novotný Jaroslav Knotek
2 Alignmenty - opakování Existují dvě základní varianty alignmentů: globální a lokální Globální: Hledáme nejlepší zarovnání dvou celých sekvencí o délkách m a n. Lokální: Hledáme takové souvislé podřetězce v obou sekvencích, že jejich globální alignment má maximální možné skóre Máme několik možností spočtení skóre lze vybrat různá ohodnocení pro match, mismatch a gap, použít různé penalizace vzhledem k velikosti díry, apod. Alignment lze spočítat dynamickým programováním v čase O(mn) s využitím paměti O(n).
3 Alignmenty v našem programu Smithův-Watermannův algoritmus. Upravený S-W algoritmus, který vrací průměr nejvyšších hodnot v tabulce. Lokální alignment, jenž má sníženou penalizaci za díry velikosti násobku tří (inspirováno chybějícím kodonem). Opět používáme část nejvyšších hodnot v tabulce. Ke každému alignmentu jsme zkoušeli i zarovnání s otočenou sekvencí (mohlo dojít k inverzím částí sekvencí).
4 Fylogenetický strom - opakování Neighbor joining tree Input: Srovnané sekvence nebo matice vzdáleností Postupné seskupování nejbližších dvojic Známe z domácí úlohy Output strom příbuzností Používáme dva způsoby určení nejbližší dvojice Připojujeme vždy dle nejvyšší hodnoty v tabulce, která vede mezi různými komponentami vytvářeného stromu. Při spojení komponent upravíme hodnoty na průměr přes všechny prvky v komponentě, následně použijeme předchozí krok. Funguje znatelně lépe
5
6 Použitá vstupní data Canis lupus Vlk obecný Macaca mulatta Makak rhesus Homo sapiens (2 chromosomy) Člověk moudrý
7 Gorilla gorilla Gorila nížinná Aquila chrysaetos Orel skalní Passer domesticus Vrabec domácí Gallus gallus Kur bankivský
8 Bombus terrestris Čmelák zemní Apis mellifera Včela medonosná Apis cerana Včela východní Agaricus bisporus Pečárka dvouvýtrusá
9 Trametes versicolor Outkovka pestrá Lactuca sativa Locika setá Helianthus annuus Slunečnice roční
10 Pinus taeda Borovice taeda Malus domestica Jabloň Pyrus bretschneideri Hrušeň
11
12 Testovací data Zkoušeli jsme dva druhy vstupů: Náhodně vybrané sekvence bází z jednotlivých organismů. Dlouhé sekvence různé délky (stovky tisíc bází). Pro kratší variantu jsme vytvořili tabulku alignmentem kompletních sekvencí. Pro delší variantu jsme pro každou dvojici organismů vybírali sadu náhodných kratších vzorků. Z principu fungování algoritmu dosahujeme lepších výsledků při alignmentu delších sekvencí.
13 Porovnávací metoda Jako skóre algoritmů jsme použili míru shody s očekávaným stromem Všechna spojení kromě nejvyššího získala skóre (1 #chyb max. #chyb) 2 pro nejlepší z netriviálních podstromů očekávaného stromu. Zcela náhodný strom získával kolem 4 ze 16 možných.
14 Naše výsledky bází Běžný lokální alignment s použitím inverze Průměrovací strom Match score: 12/16 Perfect hits: 8/16 / \ / \ / \ / \ / \ /------\ / \ /-----\ /-----\ /---\ /---\ /----\ /---\ /--\ /--\ /--\ /--\ žampion 1-jabloň 2-čmelák 3-vlk 4-včela mednonosná 5-Orel 6-včela východní 7-vrabec 8,9-člověk 10-kohout 11-hrušeň 12-locika 13-borovice 14-makak 15-slunečnice 16-choroš 17-gorila
15 Naše výsledky bází Vícehodnotový alignment s použitím inverze Maxiamlizační strom Match score: 9.15/16 Perfect hits: 5/16 / \ / \ / \ / \ / \ / \ / \ /------\ /------\ /-----\ /-----\ /---\ /----\ /----\ /--\ /--\ /--\ žampion 1-jabloň 2-čmelák 3-vlk 4-včela mednonosná 5-Orel 6-včela východní 7-vrabec 8,9-člověk 10-kohout 11-hrušeň 12-locika 13-borovice 14-makak 15-slunečnice 16-choroš 17-gorila
16 Naše výsledky bází Kodonový alignment s použitím inverze Maximalizační strom Match score: 9.71/16 Perfect hits: 7/16 / \ / \ / \ / \ / \ / \ / \ / \ /------\ /-----\ /------\ /----\ /-----\ /--\ /--\ /--\ /--\ žampion 1-jabloň 2-čmelák 3-vlk 4-včela mednonosná 5-Orel 6-včela východní 7-vrabec 8,9-člověk 10-kohout 11-hrušeň 12-locika 13-borovice 14-makak 15-slunečnice 16-choroš 17-gorila
17 Naše výsledky bází Kodonový alignment s použitím inverze Průměrovací strom Match score: 12.1/16 Perfect hits: 8/16 / \ / \ / \ / \ / \ / \ /------\ / \ /-----\ /-----\ /---\ /----\ /---\ /--\ /--\ /--\ /--\ žampion 1-jabloň 2-čmelák 3-vlk 4-včela mednonosná 5-Orel 6-včela východní 7-vrabec 8,9-člověk 10-kohout 11-hrušeň 12-locika 13-borovice 14-makak 15-slunečnice 16-choroš 17-gorila
18 Naše výsledky Vzorky 100x3000 bází Vícehodnotový alignment Průměrovací strom Match score: 9.141/16 Perfect hits: 4/16 / \ / \ / \ / \ / \ / \ / \ /------\ / \ /-----\ /-----\ /----\ /---\ /--\ /--\ /--\ /--\ žampion 1-jabloň 2-čmelák 3-vlk 4-včela mednonosná 5-Orel 6-včela východní 7-vrabec 8,9-člověk 10-kohout 11-hrušeň 12-locika 13-borovice 14-makak 15-slunečnice 16-choroš 17-gorila
19 Naše výsledky Vzorky 100x3000 bází Kodonový alignment Průměrovací strom Match score: 9.632/16 Perfect hits: 5/16 / \ / \ / \ / \ / \ / \ / \ / \ /------\ /-----\ /-----\ /----\ /----\ /--\ /--\ /--\ /--\ žampion 1-jabloň 2-čmelák 3-vlk 4-včela mednonosná 5-Orel 6-včela východní 7-vrabec 8,9-člověk 10-kohout 11-hrušeň 12-locika 13-borovice 14-makak 15-slunečnice 16-choroš 17-gorila
20 Naše výsledky Vzorky 100x3000 bází Kodonový alignment s použitím inverze Maximalizační strom Match score: 9.222/16 Perfect hits: 4/16 / \ / \ / \ / \ / \ / \ / \ / \ /------\ / \ /-----\ /-----\ /----\ /----\ /--\ /--\ /--\ žampion 1-jabloň 2-čmelák 3-vlk 4-včela mednonosná 5-Orel 6-včela východní 7-vrabec 8,9-člověk 10-kohout 11-hrušeň 12-locika 13-borovice 14-makak 15-slunečnice 16-choroš 17-gorila
21 Naše výsledky Vzorky 100x3000 bází Kodonový alignment s použitím inverze Průměrovací strom Match score: 9.582/16 Perfect hits: 4/16 / \ / \ / \ / \ / \ / \ / \ / \ /------\ /-----\ /-----\ /----\ /----\ /--\ /--\ /--\ /--\ žampion 1-jabloň 2-čmelák 3-vlk 4-včela mednonosná 5-Orel 6-včela východní 7-vrabec 8,9-člověk 10-kohout 11-hrušeň 12-locika 13-borovice 14-makak 15-slunečnice 16-choroš 17-gorila
22 Shrnutí Ukázalo se, že použití průměrné hodnoty v podstromech funguje výrazně lépe, než maximální hodnoty. Na druhou stranu, výsledky různých typů algoritmů a použití i obrácené sekvence nemělo na výsledky statisticky významný vliv. Pro kompletní alignment sekvencí o délce bází bylo průměrné skóre průměrovacího vytváření stromu 11,4. Pro vzorkování na plných sekvencích dosahovalo horších výsledků (průměrné skóre 9,2). Doba běhu cca 30 minut (bez invertované sekvence).
23 Použité komerční programy Mega7 ClustalW Improved Clustal MUSCLE Draft progressive Improved progressive Refinment Náhrada ClustalW
24 Mega - Clustal
25 Mega Clustal Nepřesné Pro krátké sekvence: Perfect hits: 1/16, match score: 7.777/16. Pro dlouhé sekvence běhové problémy, skóre odpovídající náhodnému stromu. Dlouhé trvání Použito defaultní nastavení
26 Další výsledky Chyby Mega v. 6, v. 7 Genome.jp
27 Zdroje Wikipedia.org obrázky i reference Clustal paper [ Higgins DG, Sharp PM (December 1988). "CLUSTAL: a package for performing multiple sequence alignment on a microcomputer". ] Online clustal - Sekvence -
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
1 / 23 Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 2 / 23 biologové často potřebují najít často se opakující sekvence DNA tyto sekvence bývají relativně krátké,
METODY VÍCENÁSOBNÉHO ZAROVNÁVÁNÍ NUKLEOTIDOVÝCH SEKVENCÍ
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV BIOMEDICÍNSKÉHO INŽENÝRSTVÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT
Multirobotická kooperativní inspekce
Multirobotická kooperativní inspekce prostředí Diplomová práce Multirobotická kooperativní inspekce prostředí Diplomová práce Intelligent and Mobile Robotics Group Laboratory for Intelligent Decision Making
OPTIMÁLNÍ SEGMENTACE DAT
ROBUST 2004 c JČMF 2004 OPTIMÁLNÍ SEGMENTACE DAT Petr Novotný Klíčová slova: Výpočetní statistika, po částech spojitá regrese. Abstrakt: Snížení paměťové náročnosti při výpočtu po částech spojitého regresního
Základy fylogenetiky a konstrukce fylogenetických stromů
EKO/MEM Molekulární ekologie mikroorganismů Základy fylogenetiky a konstrukce fylogenetických stromů Iva Buriánková Katedra ekologie PřF UP Kde vyrostl první fylogenetický strom? Charles Darwin (1809 1882)
Časová a prostorová složitost algoritmů
.. Časová a prostorová složitost algoritmů Programovací techniky doc. Ing. Jiří Rybička, Dr. ústav informatiky PEF MENDELU v Brně rybicka@mendelu.cz Hodnocení algoritmů Programovací techniky Časová a prostorová
Maturitní otázky z předmětu PROGRAMOVÁNÍ
Wichterlovo gymnázium, Ostrava-Poruba, příspěvková organizace Maturitní otázky z předmětu PROGRAMOVÁNÍ 1. Algoritmus a jeho vlastnosti algoritmus a jeho vlastnosti, formy zápisu algoritmu ověřování správnosti
Grafové algoritmy. Programovací techniky
Grafové algoritmy Programovací techniky Grafy Úvod - Terminologie Graf je datová struktura, skládá se z množiny vrcholů V a množiny hran mezi vrcholy E Počet vrcholů a hran musí být konečný a nesmí být
6. Tahy / Kostry / Nejkratší cesty
6. Tahy / Kostry / Nejkratší cesty BI-EP2 Efektivní programování 2 LS 2017/2018 Ing. Martin Kačer, Ph.D. 2011-18 Martin Kačer Katedra teoretické informatiky Fakulta informačních technologií České vysoké
Grafové algoritmy. Programovací techniky
Grafové algoritmy Programovací techniky Grafy Úvod - Terminologie Graf je datová struktura, skládá se z množiny vrcholů V a množiny hran mezi vrcholy E Počet vrcholů a hran musí být konečný a nesmí být
ELEKTŘINA A MAGNETIZMUS Řešené úlohy a postupy: Faradayův zákon
ELEKTŘINA A MAGNETIZMUS Řešené úlohy a postupy: Faradayův zákon Peter Dourmashkin MIT 006, překlad: Jan Pacák (007) Obsah 7. FARADAYŮV ZÁKON 7.1 ÚKOLY 7. ALGORITMUS PRO ŘEŠENÍ ÚLOH FARADAYOVÝM ZÁKONEM
Dynamic programming. Historie. Dynamické programování je obsaženo v těchto programech: Příklad: chceme optimálně přiložit dvě sekvence
Dynamic programming Dynamické programování je obsaženo v těchto programech: BLS FS lustalw HMMER enscan MFold Phylip Historie 9s matematik Richard Bellman při optimalizaci rozhodovacích procesů chtěl zmást
PROGRAMOVÁNÍ. Cílem předmětu Programování je seznámit posluchače se způsoby, jak algoritmizovat základní programátorské techniky.
Cílem předmětu Programování je seznámit posluchače se způsoby, jak algoritmizovat základní programátorské techniky. V průběhu budou vysvětlena následující témata: 1. Dynamicky alokovaná paměť 2. Jednoduché
4EK311 Operační výzkum. 5. Teorie grafů
4EK311 Operační výzkum 5. Teorie grafů 5. Teorie grafů definice grafu Graf G = uspořádaná dvojice (V, E), kde V označuje množinu n uzlů u 1, u 2,, u n (u i, i = 1, 2,, n) a E označuje množinu hran h ij,
Základy genomiky. I. Úvod do bioinformatiky. Jan Hejátko
Základy genomiky I. Úvod do bioinformatiky Jan Hejátko Masarykova univerzita, Oddělení funkční genomiky a proteomiky Laboratoř molekulární fyziologie rostlin Základy genomiky I. Zdrojová literatura ke
Testování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
Schopnost organismů UCHOVÁVAT a PŘEDÁVAT soubor informací o fyziologických a morfologických (částečně i psychických) vlastnostech daného jedince
Genetika Genetika - věda studující dědičnost a variabilitu organismů - jako samostatná věda vznikla na počátku 20. století - základy položil J.G. Mendel již v druhé polovině 19. století DĚDIČNOST Schopnost
Hemoglobin a jemu podobní... Studijní materiál. Jan Komárek
Hemoglobin a jemu podobní... Studijní materiál Jan Komárek Bioinformatika Bioinformatika je vědní disciplína, která se zabývá metodami pro shromážďování, analýzu a vizualizaci rozsáhlých souborů biologických
KLASIFIKACE ORGANISMŮ NA ZÁKLADĚ NUKLEOTIDOVÝCH ČETNOSTÍ
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV BIOMEDICÍNSKÉHO INŽENÝRSTVÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT
Vyhledávání podobných sekvencí BLAST
Vyhledávání podobných sekvencí BLAST Základní informace Následující text je součástí učebních textů předmětu Analýza sekvencí DNA a je určen hlavně pro studenty Matematické biologie. Může být ovšem přínosný
Úloha: Verifikace osoby pomocí dynamického podpisu
Cvičení z předmětu Biometrie Úloha: Verifikace osoby pomocí dynamického podpisu Jiří Wild, Jakub Schneider kontaktní email: schnejak@fel.cvut.cz 5. října 2015 1 Úvod Úloha má za cíl seznámit vás s metodami
Algoritmus pro hledání nejkratší cesty orientovaným grafem
1.1 Úvod Algoritmus pro hledání nejkratší cesty orientovaným grafem Naprogramoval jsem v Matlabu funkci, která dokáže určit nejkratší cestu v orientovaném grafu mezi libovolnými dvěma vrcholy. Nastudoval
Vzdálenost uzlů v neorientovaném grafu
Vzdálenosti a grafy Vzdálenost uzlů v neorientovaném grafu Je dán neorientovaný neohodnocený graf G = (V,E,I) vzdálenost uzlů u a v v neorientovaném souvislém grafu G je délka nejkratší cesty spojující
Metodický koncept k efektivní podpoře klíčových odborných kompetencí s využitím cizího jazyka ATCZ62 - CLIL jako výuková strategie na vysoké škole
Pattern matching Metodický koncept k efektivní podpoře klíčových odborných kompetencí s využitím cizího jazyka ATCZ62 - CI jako výuková strategie na vysoké škole Pattern matching porovnávání vzorů Hledání
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV BIOMEDICÍNSKÉHO INŽENÝRSTVÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT
Arnoldiho a Lanczosova metoda
Arnoldiho a Lanczosova metoda 1 Částečný problém vlastních čísel Ne vždy je potřeba (a někdy to není ani technicky možné) nalézt celé spektrum dané matice (velké řídké matice). Úloze, ve které chceme aproximovat
Operační výzkum. Teorie her. Řešení maticových her převodem na úlohu LP.
Operační výzkum Řešení maticových her převodem na úlohu LP. Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace magisterského studijního programu Fakulty ekonomiky a managementu
12. Globální metody MI-PAA
Jan Schmidt 2011 Katedra číslicového návrhu Fakulta informačních technologií České vysoké učení technické v Praze Zimní semestr 2011/12 MI-PAA EVROPSKÝ SOCIÁLNÍ FOND PRAHA & EU: INVESTUJENE DO VAŠÍ BUDOUCNOSTI
Algoritmy pro shlukování prostorových dat
Algoritmy pro shlukování prostorových dat Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 21. 26. leden 2018 Rybník - Hostouň
a) b) c) Radek Mařík
2012-03-20 Radek Mařík 1. Čísla ze zadané posloupnosti postupně vkládejte do prázdného binárního vyhledávacího stromu (BVS), který nevyvažujte. Jak bude vypadat takto vytvořený BVS? Poté postupně odstraňte
UČENÍ BEZ UČITELE. Václav Hlaváč
UČENÍ BEZ UČITELE Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz, http://cmp.felk.cvut.cz/~hlavac 1/22 OBSAH PŘEDNÁŠKY ÚVOD Učení
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT RNDr. Eva Janoušová INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ HODNOCENÍ ÚSPĚŠNOSTI KLASIFIKACE A SROVNÁNÍ KLASIFIKÁTORŮ ÚVOD Vstupní data Subjekt Objem hipokampu Objem komor Skutečnost
Úvod do teorie grafů
Úvod do teorie grafů Neorientovaný graf G = (V,E,I) V množina uzlů (vrcholů) - vertices E množina hran - edges I incidence incidence je zobrazení, buď: funkce: I: E V x V relace: I E V V incidence přiřadí
8 Třídy, objekty, metody, předávání argumentů metod
8 Třídy, objekty, metody, předávání argumentů metod Studijní cíl Tento studijní blok má za cíl pokračovat v základních prvcích jazyka Java. Konkrétně bude věnována pozornost třídám a objektům, instančním
Typy fylogenetických analýz
Typy fylogenetických analýz Distanční metody: Neighbor-Joining Minimum Evolultion UPGMA,... Maximum Likelihood Bayesian Inference Maximum Parsimony Genetické distance, substituční modely pro výpočet fylogenetických
Matematika pro geometrickou morfometrii
Matematika pro geometrickou morfometrii Václav Krajíček Vaclav.Krajicek@mff.cuni.cz Department of Software and Computer Science Education Faculty of Mathematics and Physics Charles University Přednáška
TESTOVÁNÍ 8. A 9. ROČNÍKŮ 2012/2013 PRŮŘEZOVÁ TÉMATA SOUHRNNÁ ZPRÁVA
TESTOVÁNÍ 8. A 9. ROČNÍKŮ 2012/2013 PRŮŘEZOVÁ TÉMATA SOUHRNNÁ ZPRÁVA Ve zprávě komentujeme výsledky testování 8. a 9. ročníků základních škol a odpovídajících ročníků víceletých gymnázií. Toto testování
Genetika BIOLOGICKÉ VĚDY EVA ZÁVODNÁ
BIOLOGICKÉ VĚDY EVA ZÁVODNÁ Genetika - věda studující dědičnost a variabilitu organismů - jako samostatná věda vznikla na počátku 20. století - základy položil J.G. Mendel již v druhé polovině 19. století
Strom života. Cíle. Stručná anotace
Předmět: Doporučený ročník: Vazba na ŠVP: Biologie 1. ročník Úvod do taxonomie Cíle Studenti zařadí člověka do příslušných taxonů taxonomického systému. Studenti se seznámí s principem fylogenetického
int ii char [16] double dd název adresa / proměnná N = nevyužito xxx xxx xxx N xxx xxx N xxx N
Struktura (union) - struktura a union jsou složené typy, které "v sobě" mohou obsahovat více proměnných - struktura obsahuje v každém okamžiku všechny své proměnné, union obsahuje (=je "aktivní") pouze
21ˆx 0 mod 112, 21x p 35 mod 112. x p mod 16. x 3 mod 17. α 1 mod 13 α 0 mod 17. β 0 mod 13 β 1 mod 17.
1. 2. test - varianta A Příklad 1.1. Kompletně vyřešte rovnici 21x 35 mod 112. Řešení. Protože gcd(112, 21) 21 má dle Frobeniovy věty rovnice řešení. Řešení nalezneme ve dvou krocích. Nejprve kompletně
STROMY. v 7 v 8. v 5. v 2. v 3. Základní pojmy. Řešené příklady 1. příklad. Stromy
STROMY Základní pojmy Strom T je souvislý graf, který neobsahuje jako podgraf kružnici. Strom dále budeme značit T = (V, X). Pro graf, který je stromem platí q = n -, kde q = X a n = V. Pro T mezi každou
Využití DNA sekvencování v
Využití DNA sekvencování v taxonomii prokaryot Mgr. Pavla Holochová, doc. RNDr. Ivo Sedláček, CSc. Česká sbírka mikroorganismů Ústav experimentální biologie Přírodovědecká fakulta Masarykova univerzita,
EVOLUCE ČLOVĚKA. úlohy k tématu + autorské řešení. Radka M. Dvořáková, Karolína Absolonová
EVOLUCE ČLOVĚKA úlohy k tématu + autorské řešení Radka M. Dvořáková, Karolína Absolonová Následující úlohy mají sloužit jako inspirace pro školní práci s informacemi, které učitelé a studenti naleznou
Vyučovací hodina. 1vyučovací hodina: 2vyučovací hodiny: Opakování z minulé hodiny. Procvičení nové látky
Vyučovací hodina 1vyučovací hodina: Opakování z minulé hodiny Nová látka Procvičení nové látky Shrnutí 5 min 20 min 15 min 5 min 2vyučovací hodiny: Opakování z minulé hodiny Nová látka Procvičení nové
( ) Slovní úlohy vedoucí na soustavy rovnic I. Předpoklady:
4..7 Slovní úlohy vedoucí na soustavy rovnic I Předpoklady: 0405 Pedagogická poznámka: Naprostou většina chyb při sestavování rovnic v následujících příkladech tvoří obrácené rovnosti ve kterých studenti
Osekvenované genomy. Pan troglodydes, 2005. Neandrtálec, 2010
GENOMOVÉ PROJEKTY Osekvenované genomy Haemophilus influenze, 1995 první osekvenovaná bakterie Saccharomyces cerevisiae, 1996 první osekvenovaný eukaryotický organimus Caenorhabditis elegans, 1998 první
Úloha - rozpoznávání číslic
Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání
Algoritmizace Dynamické programování. Jiří Vyskočil, Marko Genyg-Berezovskyj 2010
Dynamické programování Jiří Vyskočil, Marko Genyg-Berezovskyj 2010 Rozděl a panuj (divide-and-conquer) Rozděl (Divide): Rozděl problém na několik podproblémů tak, aby tyto podproblémy odpovídaly původnímu
Náplň. v.0.03 16.02.2014. - Jednoduché příklady na práci s poli v C - Vlastnosti třídění - Způsoby (algoritmy) třídění
Náplň v.0.03 16.02.2014 - Jednoduché příklady na práci s poli v C - Vlastnosti třídění - Způsoby (algoritmy) třídění Spojení dvou samostatně setříděných polí void Spoj(double apole1[], int adelka1, double
Rekurzivní algoritmy
Rekurzivní algoritmy prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy (BI-EFA) ZS
Stromy, haldy, prioritní fronty
Stromy, haldy, prioritní fronty prof. Ing. Pavel Tvrdík CSc. Katedra počítačů FEL České vysoké učení technické DSA, ZS 2008/9, Přednáška 6 http://service.felk.cvut.cz/courses/x36dsa/ prof. Pavel Tvrdík
Binární vyhledávací stromy pokročilé partie
Binární vyhledávací stromy pokročilé partie KMI/ALS lekce Jan Konečný 30.9.204 Literatura Cormen Thomas H., Introduction to Algorithms, 2nd edition MIT Press, 200. ISBN 0-262-5396-8 6, 3, A Knuth Donald
Společenstva okolí lidských obydlí
Společenstva okolí lidských obydlí Živočichové Hlemýžď zahradní Vlaštovka obecná Včela medonosná Slimák největší Myš domácí Bělásek zelný Krtek obecný Kočka Mandelinka bramborová Kur domácí Hrdlička zahradní
Stromy. Strom: souvislý graf bez kružnic využití: počítačová grafika seznam objektů efektivní vyhledávání výpočetní stromy rozhodovací stromy
Stromy úvod Stromy Strom: souvislý graf bez kružnic využití: počítačová grafika seznam objektů efektivní vyhledávání výpočetní stromy rozhodovací stromy Neorientovaný strom Orientovaný strom Kořenový orientovaný
Komprese dat (Komprimace dat)
Komprese dat (Komprimace dat) Př.: zakódovat slovo ARARAUNA K K 2 četnost absolutní relativní A 4,5 N,25 R 2,25 U,25 kód K : kód K 2 :... 6 bitů... 4 bitů prefixový kód: žádné kódové slovo není prefixem
Komprese DNA pomocí víceproudé komprese a predikce báz. Jan Jelínek, Radek Miček
Komprese DNA pomocí víceproudé komprese a predikce báz Jan Jelínek, Radek Miček Víceproudá komprese angl. Multistream compression (MSC) statistická metoda autoři: Kochánek, Lánský, Uzel, Žemlička lze použít
Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence
APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY
Metoda Monte Carlo, simulované žíhání
co byste měli umět po dnešní lekci: integrovat pomocí metody Monte Carlo modelovat jednoduché mnočásticové systémy (Brownův pohyb,...) nalézt globální minimum pomocí simulovaného žíhání Určení čísla metodou
Neparametrické metody
Neparametrické metody Dosud jsme se zabývali statistickými metodami, které zahrnovaly předpoklady o rozdělení dat. Zpravidla jsme předpokládali normální rozdělení. Např. Grubbsův test odlehlých hodnot
HUMÁNNÍ GEOGRAFIE SEMINÁŘ
HUMÁNNÍ GEOGRAFIE SEMINÁŘ 16.11. Obsah semináře: Poznámky k cv. 3, dotazy k cv. 4 Zadání cv. 5 Gravitační modely POZNÁMKY K CV. 3, DOTAZY K CV. 4 MODELY V GEOGRAFII Co je to model? Příklady? MODELY V GEOGRAFII
Státnice odborné č. 20
Státnice odborné č. 20 Shlukování dat Shlukování dat. Metoda k-středů, hierarchické (aglomerativní) shlukování, Kohonenova mapa SOM Shlukování dat Shluková analýza je snaha o seskupení objektů do skupin
2C06028-00-Tisk-ePROJEKTY
Stránka. 27 z 50 3.2. ASOVÝ POSTUP PRACÍ - rok 2009 3.2.0. P EHLED DÍL ÍCH CÍL PLÁNOVANÉ 2009 íslo podrobn Datum pln ní matematicky formulovat postup výpo t V001 výpo etní postup ve form matematických
KLASIFIKACE ORGANISMŮ NA ZÁKLADĚ NUKLEOTIDOVÝCH ČETNOSTÍ
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV BIOMEDICÍNSKÉHO INŽENÝRSTVÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT
AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza
AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Shluková analýza Cílem shlukové analýzy je nalézt v datech podmnožiny
TGH02 - teorie grafů, základní pojmy
TGH02 - teorie grafů, základní pojmy Jan Březina Technical University of Liberec 28. února 2017 Metainformace materiály: jan.brezina.matfyz.cz/vyuka/tgh (./materialy/crls8.pdf - Introduction to algorithms)
Příprava dat v softwaru Statistica
Příprava dat v softwaru Statistica Software Statistica obsahuje pokročilé nástroje pro přípravu dat a tvorbu nových proměnných. Tyto funkcionality přinášejí značnou úsporu času při přípravě datového souboru,
EKOSYSTÉM OKOLÍ LIDSKÝCH OBYDLÍ
EKOSYSTÉM OKOLÍ LIDSKÝCH OBYDLÍ Anotace: Materiál je určen k výuce přírodovědy ve 4. ročníku ZŠ. Seznamuje žáky se základními znaky a organismy ekosystému lidských obydlí. Ekosystém okolí lidských obydlí
Paralelní grafové algoritmy
Paralelní grafové algoritmy Značení Minimální kostra grafu Nejkratší cesta z jednoho uzlu Nejkratší cesta mezi všemi dvojicemi uzlů Použité značení Definition Bud G = (V, E) graf. Pro libovolný uzel u
Malcomber S.T. (2000): Phylogeny of Gaertnera Lam. (Rubiaceae) based on multiple DNA markers: evidence of a rapid radiation in a widespread,
Malcomber S.T. (2000): Phylogeny of Gaertnera Lam. (Rubiaceae) based on multiple DNA markers: evidence of a rapid radiation in a widespread, morphologically diverse genus. Evolution 56(1):42-57 Proč to
METODICKÝ LIST 1. Název výukové aktivity (tématu): 2. Jméno autora: Ing. Petr Hořejší, Ph.D., Ing. Jana Hořejší 3. Anotace:
METODICKÝ LIST 1. Název výukové aktivity (tématu): Stavba LEGO MINDSTORMS NXT robota pro třídění barevných LEGO kostek (představujících různé druhy produktů ve výrobě) 2. Jméno autora: Ing. Petr Hořejší,
IA161 Pokročilé techniky zpracování přirozeného jazyka
IA161 Pokročilé techniky zpracování přirozeného jazyka Strojový překlad Vít Baisa Překlad angličtina čeština Moses is an implementation of the statistical (or data-driven) approach to machine translation
TGH08 - Optimální kostry
TGH08 - Optimální kostry Jan Březina Technical University of Liberec 14. dubna 2015 Problém profesora Borůvky řešil elektrifikaci Moravy Jak propojit N obcí vedením s minimální celkovou délkou. Vedení
Hnojník obecný. Coprinus comatus
Hnojník obecný Coprinus comatus 20.04.2018 Vitaminy s příběhem Chrustenice 20.04.2018 Vitaminy s příběhem Chrustenice Nejúčinnější z obsahových látek Vitaminy C, D, B Vyšší obsah min. látek (draslík,
Zadání soutěžních úloh
Zadání soutěžních úloh Kategorie žáci Soutěž v programování 24. ročník Krajské kolo 2009/2010 15. až 17. dubna 2010 Úlohy můžete řešit v libovolném pořadí a samozřejmě je nemusíte vyřešit všechny. Za každou
07 Základní pojmy teorie grafů
07 Základní pojmy teorie grafů (definice grafu, vlastnosti grafu, charakteristiky uzlů, ohodnocené grafy) Definice grafu množina objektů, mezi kterými existují určité vazby spojující tyto objekty. Uspořádaná
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová. 5. Statistica
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová 5. Statistica StatSoft, Inc., http://www.statsoft.com, http://www.statsoft.cz. Verze pro Mac i PC, dostupná
Testy statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
8 Přednáška z
8 Přednáška z 3 12 2003 Problém minimální kostry: Dostaneme souvislý graf G = (V, E), w : E R + Našim úkolem je nalézt strom (V, E ) tak, aby výraz e E w(e) nabýval minimální hodnoty Řešení - Hladový (greedy)
SEQUENCE ALIGNMENT MOLEKULÁRNÍ TAXONOMIE
SEQUENCE ALIGNMENT gi 118094778 gi 68395523 Eat1 SpEat1 CG7206 DrEat1 C1orf26 46 LQELDNLKKGKML-----------------LHV-RQKAI 46 LQELDYLKSGKLS-----------------SKV-EDKAR 47 IQELDGLKKSPDIARDNDDTTN----QEHDRTI-GTLAR
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/34.0205 Šablona: III/2 Informační
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.
TÉMA: BLANOKŘÍDLÍ VYTVOŘILA: Mgr. Zdenka Wienerová VYTVOŘILA DNE: 11. 6. 2012 VY_32_Inovace/3_158
TÉMA: BLANOKŘÍDLÍ VYTVOŘILA: Mgr. Zdenka Wienerová VYTVOŘILA DNE: 11. 6. 2012 VY_32_Inovace/3_158 1 ANOTACE: INTERAKTIVNÍ PREZENTACE, PROSTŘEDNICTVÍM KTERÉ SE ŽÁK AKTIVNĚ SEZNÁMÍ SE SKUPINOU HMYZU S PROMĚNOU
Využití metod strojového učení v bioinformatice David Hoksza
Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace
Vypracovat přehled paralelních kinematických struktur. Vytvořit model a provést analýzu zvolené PKS
Autor BP: Vedoucí práce: Tomáš Kozák Ing. Jan Zavřel, Ph.D. Vypracovat přehled paralelních kinematických struktur Vytvořit model a provést analýzu zvolené PKS Provést simulaci zvolené PKS Provést optimalizaci
Zdůvodněte, proč funkce n lg(n) roste alespoň stejně rychle nebo rychleji než než funkce lg(n!). Symbolem lg značíme logaritmus o základu 2.
1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18 19 0 1 3 4 5 6 7 8 9 30 31 3 Zdůvodněte, proč funkce f(n) = n log(n) 1 n 1/ roste rychleji než funkce g(n) = n. Zdůvodněte, proč funkce f(n) = n 3/ log(n) roste
Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group
Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme
Srovnání biodiverzity sadů v různých režimech hospodaření. Martin Bagar
Srovnání biodiverzity sadů v různých režimech hospodaření Martin Bagar Zpracování monitoringu biologické rozmanitosti vinic a sadů v různých režimech produkce (konvenční, integrovaná a ekologická) Hluchý,
Strukturální regresní modely. určitý nadhled nad rozličnými typy modelů
Strukturální regresní modely určitý nadhled nad rozličnými typy modelů Jde zlepšit odhad k-nn? Odhad k-nn konverguje pro slušné k očekávané hodnotě. ALE POMALU! Jiné přístupy přidají předpoklad o funkci
Kameyama Y. et al. (2001): Patterns and levels of gene flow in Rhododendron metternichii var. hondoense revealed by microsatellite analysis.
Populační studie Kameyama Y. et al. (2001): Patterns and levels of gene flow in Rhododendron metternichii var. hondoense revealed by microsatellite analysis. Molecular Ecology 10:205 216 Proč to studovali?
Algoritmy pro práci s neúplnou informací
Michal Krkavec 23. listopadu 2011 Obsah Náhoda Expectimax Neúplné informace Monte Carlo Tree Search Perfect Information Monte Carlo Realtime plánování Plánování v RTS Monte Carlo Plánování Expectimax Expectimax
1 0 0 u 22 u 23 l 31. l u11
LU dekompozice Jedná se o rozklad matice A na dvě trojúhelníkové matice L a U, A=LU. Matice L je dolní trojúhelníková s jedničkami na diagonále a matice U je horní trojúhelníková. a a2 a3 a 2 a 22 a 23
Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011
Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe
Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry
Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet
Kosmetika a kosmetologie Přednáška 10 Funkční látky péče o kůži IV
Kosmetika a kosmetologie Přednáška 10 Funkční látky péče o kůži IV Přednáška byla připravena v rámci projektu Evropského sociálního fondu, operačního programu Vzdělávání pro konkurenceschopnost s názvem
int t1, t2, t3, t4, t5, t6, t7, prumer; t1=sys.readint();... t7=sys.readint(); prume pru r = r = ( 1+t 1+t t3+ t3+ t4 t5+ t5+ +t7 +t7 )/ ;
Pole Příklad: přečíst teploty naměřené v jednotlivých dnech týdnu, vypočítat průměrnou teplotu a pro každý den vypsat odchylku od průměrné teploty Řešení s proměnnými typu int: int t1, t2, t3, t4, t5,
Aritmetické vektory. Martina Šimůnková. Katedra aplikované matematiky. 16. března 2008
Aritmetické vektory Martina Šimůnková Katedra aplikované matematiky 16. března 2008 Martina Šimůnková (KAP) Aritmetické vektory 16. března 2008 1/ 34 Úvod 1Úvod Definice aritmetických vektorů a operací
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
CLARKEOVA-WRIGHTOVA METODA ŘEŠENÍ ÚLOHY VRP
CLARKEOVA-WRIGHTOVA METODA ŘEŠENÍ ÚLOHY VRP 1. Definice úlohy Úloha VRP (Vehicle Routing Problem problém okružních jízd) je definována na obecné dopravní síti S = (V,H), kde V je množina uzlů sítě a H
Kostry. 9. týden. Grafy. Marie Demlová (úpravy Matěj Dostál) 16. dubna 2019
Grafy 16. dubna 2019 Tvrzení. Je dán graf G, pak následující je ekvivalentní. 1 G je strom. 2 Graf G nemá kružnice a přidáme-li ke grafu libovolnou hranu, uzavřeme přesně jednu kružnici. 3 Graf G je souvislý