matematika v biologii: fylogenetika David Černý
|
|
- Jaroslava Doležalová
- před 6 lety
- Počet zobrazení:
Transkript
1 matematika v biologii: fylogenetika David Černý David Černý
2 Úvod Linné (1735), Systema Naturae: živá příroda vykazuje hierarchické uspořádání Darwin (1859), On the Origin of Species: příčinou je společný původ (common descent) existuje Strom života, všechny organizmy jsou si příbuzné, ale nestejnou měrou pokud je znak přítomen u organizmů A a B, ale chybí u organizmu C, je to proto, že jej A a B zdědili od společného předka, který nebyl předkem C
3 Fylogenetika zabývá se tím, jak příbuzenství zrekonstruovat problém: pro n taxonů počet zakořeněných binárních fylogenetických stromů p = n 2 2 (2 n ( n 3)! 2)! pro 15 taxonů jich tedy je , jen 1 je ale správný jak přijít na to, který? až do 50. let fylogenetika spíš uměním než vědou; žádná metoda s rigorózním matematickým základem
4 v 50. letech vzniká fenetika: první metoda, kterou lze algoritmizovat a která umí řešit znakové konflikty (když z různých znaků vyplývají vylučující se příbuzenství) fenetický slovníček: OTU (operační taxonomická jednotka): to, co stojí na koncích větví stromu znaková matrice: tabulka OTUs krát znaků klastr: shluk více OTUs distance: počet rozdílů mezi 2 OTUs / počet znaků ukázková metoda: UPGMA, párování pomocí nevážených aritmetických průměrů (Sokal & Michener 1958)
5 vstup: distanční matrice D nad množinou OTUs S výstup: hierarchie H nad S inicializace: vytvoř množinu klastrů C tak, aby existoval jednotkový klastr C i = {i} pro i S postup: najdi takový pár vzájemně různých klastrů {C, i C } j C, kde d(c, i C ) j je nejmenší úhlopříčnou distancí v D vyjmi C, i C j z C a nahraď je C i C ; j přidej C i C j do H pro C k C {C i C } j spočítej d(c k,(c i C )) j jako C i C i + C j C j d ( C k, Ci ) + d ( C k, C j ) C + C i j
6 opakuj postup na redukované množině C ukončení: všechny prvky C jsou zahrnuty v H
7 Problémy a nástupci fenetiky měří podobnost, ne příbuznost revoluce v systematice: Hennig (1966) publikuje Phylogenetic Systematics, vzniká kladistika; Felsenstein (1968) ve své PhD dizertaci uvádí na scénu probabilistické (= parametrické) metody nové metody by měly rozlišit informativní podobnosti (homologie) od neinformativních (homoplazií) jak? dnes 3 hlavní postupy: nejvyšší úspornost (maximum parsimony), nejvyšší věrohodnost (maximum likelihood), bayesovská analýza (Bayesian inference)
8 Úspornost (parsimonie, MP) parsimonie jako fylogenetická metoda je aplikací obecného principu parsimonie (= Ockhamovy břitvy) optimální strom je takový, který minimalizuje počet přechodů z jednoho znakového stavu do druhého (0 1, A G,...) NP-těžká úloha: není znám algoritmus, který by ji řešil v t = An x, kde A, x jsou konstanty a n počet OTUs řeší se heuristickými algoritmy (metoda lokálního hledání: najde řešení v rozumném čase, ale jen aproximativní)
9 Problémy s parsimonií statisticky nekonzistentní: Felsenstein (1978) dokázal, že při jisté sadě parametrů (Felsensteinova zóna) nejenže nenajde správný strom, ale s více daty bude ten špatný čím dál tím víc potvrzovat FZ: 2 OTUs na 4-taxonovém FZ: 2 OTUs na 4-taxonovém stromě mají daleko vyšší rychlost evoluce než ty zbývající, ale nejsou si příbuzné: homoplazie mezi těmi rychlejšími přebijí jejich homologie s těmi pomalejšími přitahování dlouhých větví
10 Věrohodnost (likelihood, ML) jiné kritérium optimality: nejlepší strom je ten s největší věrohodností, přičemž V ( τ D) = P( D τ ) abychom dokázali určit pravděpodobnost, že se vyvinou zrovna data D, nestačí znát jen topologii: potřebujeme další ( rušivé ) parametry samy o sobě nás nezajímají, ale pracovat s nimi musíme souhrn rušivých parametrů = evoluční model: tím se ML liší od MP, která ho nemá (aspoň ne explicitně; viz níže)
11 P( D τ ) = P( D τ, θ ) dφ ( θ τ ), kde θ jsou rušivé parametry (např. délky větví, tj. tempo evoluce), Ф(θ τ) je funkce značící rozložení rušivých parametrů v závislosti na stromu τ předpoklad zní, že rušivé parametry zintegrujeme, ale to nebylo možné až do 90. let, kdy jsme se naučili aproximovat integrál technikou tzv. Markovových řetězců Monte Carlo (MCMC) většinou prostě předpokládáme, že rušivé parametry nabývají takových hodnot, aby P(D τ) byla nejvyšší
12 Příklad modelu: HKY85 Hasegawa, Kishino & Yano (1985), kde π T/C/A/G = zastoupení tyminu/cytozinu/adeninu/guaninu v analyzované DNA sekvenci; pravděpodobnost transverzí (A T, C G) = 1; poměr tranzic (A G, C T) k transverzím = κ
13 délka větve: ke kolika bodovým mutacím dojde na jedné nukleotidové pozici l = 1 2( π + π )( π + π ) + 2κ ([ π π ] + [ π A G C T A G C π T ]) Věrohodnost kontra parsimonie zastánci statistického přístupu dlouho hledali model implicitně obsažený v parsimonii Tuffley & Steel (1997) jej našli: každý znak na každé větvi v něm může mutovat jinak rychle; když přidáme 1 znak navíc, dostáváme (2n 3) nových parametrů
14
15 Bayesovská analýza aplikace bayesovské statistiky, kontroverzní alternativy ke klasické (frekventistické) statistice hlavní rozdíl: pravděpodobnost je subjektivní a značí míru nejistoty, ne frekvenci jevu při velkém počtu pokusů základem Bayesův teorém: P( H D) = P( H P( D H P( D) posteriorní pravděpodobnost hypotézy H = priorní pravděpodobnost H krát věrohodnostní poměr ) )
16 upravený tvar: P po P( D τ ) P ( ( τ D) = i pr i B( s) P( D τ ) P = j j 1 kde P po (τ i D) je posteriorní pravděpodobnost stromu i, P(D τ i ) jeho věrohodnost, P pr (τ i ) jeho priorní pravděpodobnost, a kde jmenovatel představuje sumu všech B možných stromů pro s OTUs věrohodnost předpokládá pro parametry evolučního modelu pevnou, avšak neznámou hodnotu; pro Bayese jsou to jen další náhodné proměnné τ i pr ) ( τ j ),
17
18 MCMC nám dá reprezentativní vzorek posteriorního rozdělení; posteriorní pravděpodobnost kladu C i odpovídá tomu, na kolika stromech z tohoto vzorku se vyskytuje Bayes má kritérium optimality (nejlepší je strom s nejvyšší posteriorní pravděpodobností), ale většinou ho nevyužíváme: chceme konsenzový strom, tj. prosté shrnutí posteriorního rozdělení, složené z nejčastěji nalézaných kladů kritikům Bayese nejvíc vadí subjektivní priory: máme právo předem říct, že je nějaký strom pravděpodobnější než jiný? flat priors priorní pravděpodobnost je nastavena pro všechny stromy stejná ukazuje se, že rozdílné priorní pravděpodobnosti neovlivňují výsledek tolik jako použitý model a data
19 Citovaná literatura: Felsenstein J 1968 Statistical inference and the estimation of phylogenies. PhD Dissertation, Univ Chicago, Chicago Felsenstein J 1978 Cases in which parsimony and compatibility methods will be positively misleading. Syst Zool 27: Hasegawa M, Kishino H, Yano T 1985 Dating of human-ape splitting by a molecular clock of mitochondrial DNA. J Mol Evol 22: Hennig W 1966 Phylogenetic Systematics. Univ of Illinois Press, Urbana Sokal RR, Michener CD 1958 A statistical method for evaluating systematic relationships. Univ Kansas Sci Bull 38: Tuffley C, Steel M 1997 Links between maximum likelihood and maximum parsimony under a simple model of site substitution. Bull Math Biol 59: Zdroje ilustrací: Huelsenbeck JP, Ané C, Larget B, Ronquist F 2008 A Bayesian perspective on a non-parsimonious parsimony model. Syst Biol 57: (pravděpodobnostní vzoreček, slide 1) Suh A, Paus M, Kiefmann M, Churakov G, Franke FA, Brosius J, Kriegs JO, Schmitz J 2011 Mesozoic retroposons reveal parrots as the closest living relatives of passerine birds. Nature Comms 2: 443 (zarovnané sekvence, slide 1) Lee MSY, Worthy TH 2011 Likelihood reinstates Archaeopteryx as a primitive bird. Biol Lett doi: /rsbl (split frequencies diagram, slide 1) Mayr G 2010 Parrot interrelationships morphology and the new molecular phylogenies. Emu 110: (fylogenetický stromek, slide 1) Gronau I, Moran S 2007 Optimal implementations of UPGMA and other common clustering algorithms. Inf Process Lett 104 (6): (distanční matrice, slide 6) Philippe H, Zhou Y, Brinkmann H, Rodrigue N, Delsuc F 2005 Heterotachy and long-branch attraction in phylogenetics. BMC Evol Biol 5: 50 (Felsensteinova zóna, slide 9) (HKY85 model, slide 12) Swofford DL, Waddell PJ, Huelsenbeck JP, Foster PG, Lewis PO, Rogers JS 2001 Bias in phylogenetic estimation and its relevance to the choice between parsimony and likelihood methods. Syst Biol 50: (věrohodnost vs. parsimonie, slide 14) (bayesovské pravděpodobnosti, slide 17)
20 Děkuji za pozornost.
Typy fylogenetických analýz
Typy fylogenetických analýz Distanční metody: Neighbor-Joining Minimum Evolultion UPGMA,... Maximum Likelihood Bayesian Inference Maximum Parsimony Genetické distance, substituční modely pro výpočet fylogenetických
2. Maximální úspornost (Maximum Parsimony, MP)
2. Maximální úspornost (Maximum Parsimony, MP) Ze všech metod konstrukce fylogenetických stromů byly donedávna nejpoužívanější metody maximální úspornosti (parsimonie). Důvodem pro jejich mimořádnou oblibu
Systém a evoluce obratlovců I.Úvod
MODULARIZACE VÝUKY EVOLUČNÍ A EKOLOGICKÉ BIOLOGIE CZ.1.07/2.2.00/15.0204 Systém a evoluce obratlovců I.Úvod literatura taxonomie a systematika znaky a klasifikace Carl Linné Willy Hennig Literatura 2007
Fylogeneze a diverzita obratlovců I.Úvod
MODULARIZACE VÝUKY EVOLUČNÍ A EKOLOGICKÉ BIOLOGIE CZ.1.07/2.2.00/15.0204 Fylogeneze a diverzita obratlovců I.Úvod literatura taxonomie a systematika znaky a klasifikace Carl Linné Willy Hennig Charles
Pravděpodobnost, náhoda, kostky
Pravděpodobnost, náhoda, kostky Radek Pelánek IV122 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností připomenutí, souvislosti
Algoritmy pro shlukování prostorových dat
Algoritmy pro shlukování prostorových dat Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 21. 26. leden 2018 Rybník - Hostouň
Pravděpodobnost, náhoda, kostky
Pravděpodobnost, náhoda, kostky Radek Pelánek IV122, jaro 2015 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností krátké
Pravděpodobnost vs. Poměr šancí. Pravděpodobnostní algoritmy: Bayesova věta. Bayesova teorie rozhodování. Bayesova věta (teorém) Vzorec. ...
ravděpodobnostní algoritmy: Bayesova věta Fantasy is hardly an escape from reality. It is a way of understanding it. LLoyd Alexander ravděpodobnost vs. oměr šancí ravděpodobnost - poměr počtu jedinců surčitým
Systematická biologie je věda o rozmanitosti organizmů (E. Mayr 1969: Principles of systematic zoology. Mac Graw Hill Book Co., New York X+428 p.).
základy taxonomie a systematiky Systematická biologie je věda o rozmanitosti organizmů (E. Mayr 1969: Principles of systematic zoology. Mac Graw Hill Book Co., New York X+428 p.). Základním posláním systematiky
PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady
PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným
MOLEKULÁRNÍ TAXONOMIE 9
MOLEKULÁRNÍ TAXONOMIE 9 Zdokonalování substitučního modelu V předchozích přednáškách jsme si představili metodu maximum likelihood, která počítá s pravděpodobnostmi substitucí na větvích a topologiích.
cluster clusters cluster cluster hierarchické klastrování: => strom je jedním z grafických znázornění hierarchického klastrování:
Fylogenetika klastrovat na základě podobnosti lze cokoliv, vůbec nemusí jít o evoluční záležitosti (= lidstvo potřebuje popisovat a škatulkovat), je to obecný matematický základ pro analýzy dat, data mining,
Aplikace DNA markerů v mykologii a molekulárni taxonomii
Mendelova genetika v příkladech Aplikace DNA markerů v mykologii a molekulárni taxonomii doc. RNDr. Michal Tomšovský, Ph.D., Ústav ochrany lesů a myslivosti, LDF MENDELU, Brno Tento projekt je spolufinancován
Jak se matematika poučila v biologii
Jak se matematika poučila v biologii René Kalus IT4Innovations, VŠB TUO Role matematiky v (nejen) přírodních vědách Matematika inspirující a sloužící jazyk pro komunikaci s přírodou V 4 3 r 3 Matematika
Malcomber S.T. (2000): Phylogeny of Gaertnera Lam. (Rubiaceae) based on multiple DNA markers: evidence of a rapid radiation in a widespread,
Malcomber S.T. (2000): Phylogeny of Gaertnera Lam. (Rubiaceae) based on multiple DNA markers: evidence of a rapid radiation in a widespread, morphologically diverse genus. Evolution 56(1):42-57 Proč to
Umělá inteligence II
Umělá inteligence II 11 http://ktiml.mff.cuni.cz/~bartak Roman Barták, KTIML roman.bartak@mff.cuni.cz Dnešní program! V reálném prostředí převládá neurčitost.! Neurčitost umíme zpracovávat pravděpodobnostními
Základy fylogenetiky a konstrukce fylogenetických stromů
EKO/MEM Molekulární ekologie mikroorganismů Základy fylogenetiky a konstrukce fylogenetických stromů Iva Buriánková Katedra ekologie PřF UP Kde vyrostl první fylogenetický strom? Charles Darwin (1809 1882)
Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead
PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické usuzování, odhady Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead Barevná srdíčka kolegyně
ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz DATA, VÝZKUM, ANALÝZY ve výzkumu se střídají fáze prozkoumávací
BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni
BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X
UČENÍ BEZ UČITELE. Václav Hlaváč
UČENÍ BEZ UČITELE Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz, http://cmp.felk.cvut.cz/~hlavac 1/22 OBSAH PŘEDNÁŠKY ÚVOD Učení
PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady
PRAVDĚPODOBNOST A STATISTIKA Bayesovské odhady Bayesovské odhady - úvod Klasický bayesovský přístup: Klasický přístup je založen na opakování pokusech sledujeme rekvenci nastoupení zvolených jevů Bayesovský
1. seznámení s on-line databázemi, nástroji a softwarem (databáze, vyhledání sekvencí, základní manipulace se sekvencemi, navržení primerů)
Počítačováčást 1. seznámení s on-line databázemi, nástroji a softwarem (databáze, vyhledání sekvencí, základní manipulace se sekvencemi, navržení primerů) Pavel Munclinger, Petr Synek 2. fylogenetická
Tribsch A., Schönswetter P. & Stuessy T. (2002): Saponaria pumila (Caryophyllaceae) and the Ice Age in the European Alps. American Journal of Botany
Populační studie Tribsch A., Schönswetter P. & Stuessy T. (2002): Saponaria pumila (Caryophyllaceae) and the Ice Age in the European Alps. American Journal of Botany 89(12): 2024 2033 Proč to studovali?
Teorie neutrální evoluce a molekulární hodiny
Teorie neutrální evoluce a molekulární hodiny Teorie neutrální evoluce Konec 60. a začátek 70. let 20. stol. Ukazuje jak bude vypadat genetická variabilita v populaci a jaká bude rychlost divergence druhů
4. Úvod do kladistiky. kladogram podobnost a příbuznost homologie (sym)plesiomorfie, (syn)apomorfie polarizace znaků kritérium parsimonie
4. Úvod do kladistiky kladogram podobnost a příbuznost homologie (sym)plesiomorfie, (syn)apomorfie polarizace znaků kritérium parsimonie Willi Hennig (1913-1976) německý entomolog 1950: Grundzüge einer
Bioinformatika a výpočetní biologie. KFC/BIN VII. Fylogenetická analýza
ioinformatika a výpočetní biologie KF/IN VII. Fylogenetická analýza RNr. Karel erka, Ph.. Univerzita Palackého v Olomouci Fylogeneze Vznik a vývoj jednotlivých linií organismů Vývoj člověka phylogenetic
Inovace studia molekulární a buněčné biologie
Investice do rozvoje vzdělávání Inovace studia molekulární a buněčné biologie Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Investice do rozvoje vzdělávání
Akvizice dat. Dekonvoluce Registrace. zobrazení INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
a analýza signálů v perfúzním zobrazení Ústav biomedicínského inženýrství FEKT, VUT v Brně 22. 5. 2009 INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Osnova Úvod 1 Úvod 2 3 4 5 Úvod diagnostika a průběh terapie nádorových
Odhady - Sdružené rozdělení pravděpodobnosti
Odhady - Sdružené rozdělení pravděpodobnosti 4. listopadu 203 Kdybych chtěl znát maximum informací o náhodné veličině, musel bych znát všechny hodnoty, které mohou padnout, a jejich pravděpodobnosti. Tedy
Vytěžování znalostí z dat
Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 7 1/27 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology
oddělení Inteligentní Datové Analýzy (IDA)
Vytěžování dat Filip Železný Katedra počítačů oddělení Inteligentní Datové Analýzy (IDA) 22. září 2014 Filip Železný (ČVUT) Vytěžování dat 22. září 2014 1 / 25 Odhad rozdělení Úloha: Vstup: data D = {
Teorie neutrální evoluce a molekulární hodiny
Teorie neutrální evoluce a molekulární hodiny Teorie neutrální evoluce Konec 60. a začátek 70. let 20. stol. Ukazuje jak bude vypadat genetická variabilita v populaci a jaká bude rychlost evoluce v případě,
Intervalová data a výpočet některých statistik
Intervalová data a výpočet některých statistik Milan Hladík 1 Michal Černý 2 1 Katedra aplikované matematiky Matematicko-fyzikální fakulta Univerzita Karlova 2 Katedra ekonometrie Fakulta informatiky a
Klasifikace a rozpoznávání. Bayesovská rozhodovací teorie
Klasifikace a rozpoznávání Bayesovská rozhodovací teorie Extrakce p íznaků Granáty Četnost Jablka Váha [dkg] Pravděpodobnosti - diskrétní p íznaky Uvažujme diskrétní p íznaky váhové kategorie Nechť tabulka
Základní pojmy I. EVOLUCE
Základní pojmy I. EVOLUCE Medvěd jeskynní Ursus spelaeus - 5 mil. let? - 10 tis. let - 200 tis. let? Medvěd hnědý Ursus arctos Medvěd lední Ursus maritimus Základní otázky EVOLUCE Jakto, že jsou tu různé
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
1 / 23 Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 2 / 23 biologové často potřebují najít často se opakující sekvence DNA tyto sekvence bývají relativně krátké,
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
Motivace. Náhodný pokus, náhodný n jev. Pravděpodobnostn. podobnostní charakteristiky diagnostických testů, Bayesův vzorec
Pravděpodobnostn podobnostní charakteristiky diagnostických testů, Bayesův vzorec Prof.RND.Jana Zvárov rová,, DrSc. Motivace V medicíně má mnoho problémů pravěpodobnostní charakter prognóza diagnoza účinnost
BOOTSTRAPPINGOVÉ METODY VE FYLOGENETICE
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV BIOMEDICÍNSKÉHO INŽENÝRSTVÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Bayesovské modely Doc. RNDr. Iveta Mrázová, CSc.
Cíle lokalizace. Zjištění: 1. polohy a postavení robota (robot pose) 2. vzhledem k mapě 3. v daném prostředí
Cíle lokalizace Zjištění: 1. polohy a postavení robota (robot pose) 2. vzhledem k mapě 3. v daném prostředí 2 Jiný pohled Je to problém transformace souřadnic Mapa je globální souřadnicový systém nezávislý
Taxonomický systém a jeho význam v biologii
Taxonomie Taxonomický systém a jeho význam v biologii -věda zabývající se tříděním organismů (druhů, rodů, ), jejich vzájemnou příbuzností a podobností. 3 úrovně: 1) charakteristika, pojmenování, vymezení
Odhad stavu matematického modelu křižovatek
Odhad stavu matematického modelu křižovatek Miroslav Šimandl, Miroslav Flídr a Jindřich Duník Katedra kybernetiky & Výzkumné centrum Data-Algoritmy-Rozhodování Fakulta aplikovaných věd Západočeská univerzita
Usuzování za neurčitosti
Usuzování za neurčitosti 25.11.2014 8-1 Usuzování za neurčitosti Hypotetické usuzování a zpětná indukce Míry postačitelnosti a nezbytnosti Kombinace důkazů Šíření pravděpodobnosti v inferenčních sítích
Zpětnovazební učení Michaela Walterová Jednoocí slepým,
Zpětnovazební učení Michaela Walterová Jednoocí slepým, 17. 4. 2019 V minulých dílech jste viděli Tři paradigmata strojového učení: 1) Učení s učitelem (supervised learning) Trénovací data: vstup a požadovaný
Úvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
1. Systematika, taxonomie a stručný přehled jejich historického vývoje
1. Systematika, taxonomie a stručný přehled jejich historického vývoje program semestru, organizační záležitosti studijní literatura náplň systematiky, taxonomie a nomenklatury přehled jejich historického
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
Rekonstrukce křivek a ploch metodou postupné evoluce
Rekonstrukce křivek a ploch metodou postupné evoluce Univerzita Karlova v Praze Matematicko-fyzikální fakulta petra.surynkova@mff.cuni.cz Přehled Evoluce křivek princip evoluce použití evoluce křivky ve
SRE 03 - Statistické rozpoznávání
SRE 03 - Statistické rozpoznávání vzorů II Lukáš Burget ÚPGM FIT VUT Brno, burget@fit.vutbr.cz FIT VUT Brno SRE 03 - Statistické rozpoznávání vzorů II Lukáš Burget, ÚPGM FIT VUT Brno, 2006/07 1/29 Opakování
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty
Pravděpodobně skoro správné. PAC učení 1
Pravděpodobně skoro správné (PAC) učení PAC učení 1 Výpočetní teorie strojového učení Věta o ošklivém kačátku. Nechť E je klasifikovaná trénovací množina pro koncept K, který tvoří podmnožinu konečného
Strojové učení Marta Vomlelová
Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV BIOMEDICÍNSKÉHO INŢENÝRSTVÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT
Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. Př. : Ve vjezdové skupině kolejí byly sledovány počty přijíždějících vlaků za hodinu. Za 5 dní (tedy 360 hodin) přijelo celkem 87 vlaků. Výsledky sledování jsou uvedeny v tabulce.
Bayesovská klasifikace
Bayesovská klasifikace založeno na Bayesově větě P(H E) = P(E H) P(H) P(E) použití pro klasifikaci: hypotéza s maximální aposteriorní pravděpodobností H MAP = H J právě když P(H J E) = max i P(E H i) P(H
STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT
STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT (NE)VÝHODY STATISTIKY OTÁZKY si klást ještě před odběrem a podle nich naplánovat design, metodiku odběru (experimentální vs.
Robustní odhady statistických parametrů
Robustní odhady statistických parametrů ěkdy pracují dobře, jinde ne. Typická data - pozorování BL Lac 100 mag 40 0 0.41 0.40 JD date 0.39 0.38 0.38223-1.586 0.017 0.40550-1.530 0.019 0.39453-1.610 0.024
Vícerozměrné statistické metody
Vícerozměrné statistické metody Shluková analýza Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Typy shlukových analýz Shluková analýza: cíle a postupy Shluková analýza se snaží o
Metody zpracování fyzikálních měření
etody zpracování fyzikálních měření Jakub Čížek katedra fyziky nízkých teplot Tel: 9 788 jakub.cizek@mff.cuni.cz http://physics.mff.cuni.cz/kfnt/vyuka/metody/obsah.html Doporučená literatura: D.S. Silva,
23. Matematická statistika
Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 23. Matematická statistika Statistika je věda, která se snaží zkoumat reálná data a s pomocí teorii pravděpodobnosti
pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.
3.1 Základy teorie pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti. Co se dozvíte Náhodný pokus a náhodný jev. Pravděpodobnost, počítání s pravděpodobnostmi.
Aktivní detekce chyb
Fakulta aplikovaných věd, Katedra kybernetiky a Výzkumné centrum Data - Algoritmy - Rozhodování Západočeská univerzita v Plzni Prezentace v rámci odborného semináře Katedry kybernetiky Obsah Motivační
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
Využití DNA sekvencování v
Využití DNA sekvencování v taxonomii prokaryot Mgr. Pavla Holochová, doc. RNDr. Ivo Sedláček, CSc. Česká sbírka mikroorganismů Ústav experimentální biologie Přírodovědecká fakulta Masarykova univerzita,
Speciace a extinkce. Druh
Speciace a extinkce Druh Tři procesy biogeografie evoluce vymírání šíření = tři základní způsoby jimiž organismy odpovídají na prostorovou a časovou dynamiku geografických podmínek jen pro připomenutí
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Monte Carlo Lokalizace. Martin Skalský
Monte Carlo Lokalizace Martin Skalský Proč Lokalizace? Problém určení pozice robota a věcí kolem něj. (filtrování dat, state estimation) Je důležitá Knowledge about where things are is at the core of any
Systém a evoluce živočichů
Systém a evoluce živočichů 1. Bezobratlí (Dipl.-Biol. Jiří Schlaghamerský, Ph.D.; RNDr Jana Schenková, Ph.D.) 2. Strunatci (Mgr. Tomáš Bartonička, Ph.D.) Osnova pro část bezobratlí : 1) Úvod do zoologické
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz LITERATURA Holčík, J.: přednáškové prezentace Holčík, J.: Analýza a klasifikace signálů.
6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života?
6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života? Pamatujete na to, co se objevilo v pracích Charlese Darwina a Alfreda Wallace ohledně vývoje druhů? Aby mohl mechanismus přírodního
Cvičení ze statistiky - 7. Filip Děchtěrenko
Cvičení ze statistiky - 7 Filip Děchtěrenko Minule bylo.. Probrali jsme spojité modely Tyhle termíny by měly být známé: Rovnoměrné rozdělení Střední hodnota Mccalova transformace Normální rozdělení Přehled
Binární vyhledávací stromy pokročilé partie
Binární vyhledávací stromy pokročilé partie KMI/ALS lekce Jan Konečný 30.9.204 Literatura Cormen Thomas H., Introduction to Algorithms, 2nd edition MIT Press, 200. ISBN 0-262-5396-8 6, 3, A Knuth Donald
Robustní statistické metody
Populární úvod Ústav teoretické fyziky a astrofyziky, MU Brno 28. říjen 2006, Vlašim O co jde? Robustní znamená: necitlivý k malým odchylkám od ideálních předpokladů na který je metoda odhadu optimalizována.
Klasifikace a rozpoznávání. Bayesovská rozhodovací teorie
Klasifikace a rozpoznávání Bayesovská rozhodovací teorie Extrakce příznaků 3 25 2 Granáty Jablka Četnost 15 1 5 2 3 4 5 6 7 8 Váha [dkg] Pravděpodobnosti - diskrétní příznaky Uvažujme diskrétní příznaky
Statistika pro geografy
Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických
Aplikovaná statistika v R - cvičení 2
Aplikovaná statistika v R - cvičení 2 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.6.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.6.2014 1 / 18 Přehled Rkových
STATISTICKÉ VYHODNOCENÍ FYLOGENEZE BIOLOGICKÝCH SEKVENCÍ
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV BIOMEDICÍNSKÉHO INŽENÝRSTVÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Populační genetika III. Radka Reifová
Populační genetika III Radka Reifová Genealogie, speciace a fylogeneze Genové genealogie Rodokmeny jednotlivých kopií určitého genu v populaci. Popisují vztahy mezi kopiemi určitého genu v populaci napříč
jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.
Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment
Odhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
Studijní program Matematika Obor Pravděpodobnost, matematická statistika a ekonometrie
Studijní program Matematika Obor Pravděpodobnost, matematická statistika a ekonometrie Doporučené průběhy studia pro rok 2014/15 24. září 2014 Vysvětlivky: Tento dokument obsahuje několik alternativních
Základy botaniky vyšších rostlin. Zdeňka Lososová
Základy botaniky vyšších rostlin Zdeňka Lososová Studijní literatura Mártonfi P.: Systematika cievnatých rastlín. Univerzita P.J. Šafárika, Košice, 2003 Smejkal M.: Systém a evoluce vyšších rostlin. In:
Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole 1815 1864. Aplikace booleovské logiky
Modely vyhledávání informací 4 podle technologie 1) Booleovský model 1) booleovský 2) vektorový 3) strukturní 4) pravděpodobnostní a další 1 dokumenty a dotazy jsou reprezentovány množinou indexových termů
MOLEKULÁRNÍ TAXONOMIE 10
MOLEKULÁRNÍ TAXONOMIE 10 Molekulární hodiny Skutečnost, že počet substitučních událostí vzrůstá s časem, vedla velmi brzy ke snahám využít sekvencí k datování stáří uzlů na fylogenetických stromech. Jako
POŽADAVKY K SOUBORNÉ ZKOUŠCE Z MATEMATIKY
POŽADAVKY K SOUBORNÉ ZKOUŠCE Z MATEMATIKY Bakalářský studijní program B1101 (studijní obory - Aplikovaná matematika, Matematické metody v ekonomice, Aplikovaná matematika pro řešení krizových situací)
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Evoluční algoritmy. Podmínka zastavení počet iterací kvalita nejlepšího jedince v populaci změna kvality nejlepšího jedince mezi iteracemi
Evoluční algoritmy Použítí evoluční principů, založených na metodách optimalizace funkcí a umělé inteligenci, pro hledání řešení nějaké úlohy. Populace množina jedinců, potenciálních řešení Fitness function
Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.
1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový
Testování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
Citation Statistics. zpráva společné komise. Int. Mathematical Union. Int. Council of Industrial and Applied Mathematics. Institute of Statistics
Citation Statistics zpráva společné komise Int. Mathematical Union Int. Council of Industrial and Applied Mathematics Institute of Statistics Citace ze zadání: The drive towards more transparency and accountability
Ing. Alena Šafrová Drášilová, Ph.D.
Rozhodování Ing. Alena Šafrová Drášilová, Ph.D. Rozhodování??? video Obsah typy rozhodování principy rozhodování rozhodovací fáze základní pojmy hodnotícího procesu rozhodovací podmínky rozhodování v podmínkách
Ing. Tomáš MAUDER prof. Ing. František KAVIČKA, CSc. doc. Ing. Josef ŠTĚTINA, Ph.D.
OPTIMALIZACE BRAMOVÉHO PLYNULÉHO ODLÉVÁNÍ OCELI ZA POMOCI NUMERICKÉHO MODELU TEPLOTNÍHO POLE Ing. Tomáš MAUDER prof. Ing. František KAVIČKA, CSc. doc. Ing. Josef ŠTĚTINA, Ph.D. Fakulta strojního inženýrství
Pravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
Přednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky
řednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky Statistika vychází z pravděpodobnosti odmíněná pravděpodobnost, Bayesův vzorec Senzitivita, specificita, prediktivní hodnoty Frekventistická
Strom života. Cíle. Stručná anotace
Předmět: Doporučený ročník: Vazba na ŠVP: Biologie 1. ročník Úvod do taxonomie Cíle Studenti zařadí člověka do příslušných taxonů taxonomického systému. Studenti se seznámí s principem fylogenetického
Nadaní v přírod. vědách. Jiřina Novotná Katedra matematiky Pedagogická fakulta MU Brno
Nadaní v přírod. vědách Jiřina Novotná Katedra matematiky Pedagogická fakulta MU Brno Úvod charakteristika nadaných Oblast poznávání: - schopnost manipulovat abstraktními symbolickými systémy, - schopnost