ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ

Podobné dokumenty
ANALÝZA A KLASIFIKACE DAT

Následující text je součástí učebních textů předmětu Bi0034 Analýza a klasifikace dat a je určen

Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY a SYSTÉMY

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Úvodem Dříve les než stromy 3 Operace s maticemi

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Úvod do zpracování signálů

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

SIGNÁLY A LINEÁRNÍ SYSTÉMY

analýzy dat v oboru Matematická biologie

Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY, ČASOVÉ ŘADY a SYSTÉMY

Pokročilé neparametrické metody. Klára Kubošová

Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY, ČASOVÉ ŘADY a SYSTÉMY

SIGNÁLY A LINEÁRNÍ SYSTÉMY

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Moderní systémy pro získávání znalostí z informací a dat

Využití metod strojového učení v bioinformatice David Hoksza

Cvičná bakalářská zkouška, 1. varianta

Úvod do medicínské informatiky pro Bc. studium. 6. přednáška

Elektronická podpora výuky na ÚBMI

ANALÝZA A KLASIFIKACE DAT

ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ

Biofyzikální ústav LF MU Brno. jarní semestr 2011

Měření závislosti statistických dat

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně

Přednáška 13 Redukce dimenzionality

A/D převodníky - parametry

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně

Měření dat Filtrace dat, Kalmanův filtr

Kompresní metody první generace

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně

Restaurace (obnovení) obrazu při známé degradaci

ÚVOD DO ROZHODOVÁNÍ PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ Přednáška 1. Zuzana Bělinová

UČENÍ BEZ UČITELE. Václav Hlaváč

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

OSA. maximalizace minimalizace 1/22

Odhad stavu matematického modelu křižovatek

25. DIGITÁLNÍ TELEVIZNÍ SIGNÁL A KABELOVÁ TELEVIZE

Stavový model a Kalmanův filtr

Ing. Jan Buriánek. Katedra softwarového inženýrství Fakulta informačních technologií České vysoké učení technické v Praze Jan Buriánek, 2010

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Kybernetika a umělá inteligence, cvičení 10/11

Strukturální regresní modely. určitý nadhled nad rozličnými typy modelů

ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ

Katedra kybernetiky, FEL, ČVUT v Praze.

Hledání optimální polohy stanic a zastávek na tratích regionálního významu

vzorek vzorek

Využití strojového učení k identifikaci protein-ligand aktivních míst

ANALÝZA A KLASIFIKACE DAT. Institut biostatistiky a analýz

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder

1. Základy teorie přenosu informací

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Diskriminační analýza hodnocení rozdílů mezi 2 nebo více skupinami objektů charakterizovanými více znaky

1. Statistická analýza dat Jak vznikají informace Rozložení dat

Reprezentace bodu, zobrazení

Metody zpracování a analýzy medicínských obrazových dat: možnosti využití v neurovědním výzkumu

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Měření dat Filtrace dat, Kalmanův filtr

Matematika pro geometrickou morfometrii

KLASIFIKÁTOR MODULACÍ S VYUŽITÍM UMĚLÉ NEURONOVÉ SÍTĚ

Přednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky

Státnice odborné č. 20

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Vícerozměrné statistické metody

Náhodné signály. Honza Černocký, ÚPGM

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

Automatické vyhledávání informace a znalosti v elektronických textových datech

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

ANALÝZA A KLASIFIKACE DAT

MATEMATICKÁ BIOLOGIE

TECHNICKÁ UNIVERZITA V LIBERCI

Technická diagnostika, chyby měření

ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Cíle lokalizace. Zjištění: 1. polohy a postavení robota (robot pose) 2. vzhledem k mapě 3. v daném prostředí

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

AVDAT Mnohorozměrné metody, metody klasifikace

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Analýza dat na PC I.

8. Sběr a zpracování technologických proměnných

Teorie systémů TES 1. Úvod

TECHNICKÁ DIAGNOSTIKA

SIGNÁLY A LINEÁRNÍ SYSTÉMY

ití empirických modelů při i optimalizaci procesu mokré granulace léčivl ková SVK ÚOT

Univerzita Pardubice 8. licenční studium chemometrie

Algoritmy a struktury neuropočítačů ASN - P11

Akvizice dat. Dekonvoluce Registrace. zobrazení INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ

Geometrické transformace

Analýza a zpracování signálů

POZNÁMKY K PŘEDMĚTU PROJEKT

Chybějící atributy a postupy pro jejich náhradu

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

ANALÝZA A KLASIFIKACE DAT

Předzpracování dat. Lenka Vysloužilová

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Transkript:

ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz

5. LETNÍ ŠKOLA MATEMATICKÉ BIOLOGIE ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ čtvrtek 21. V. 2009 Mezidruhová komunikace aneb jak rozumět některým pojmům Aplikace pátek 22. V. 2009 studentská soutěž sobota 23. V. 2009

5. LETNÍ ŠKOLA MATEMATICKÉ BIOLOGIE ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ čtvrtek 21. V. 2009 Mezidruhová komunikace aneb jak rozumět některým pojmům 8:15 9:00 Úvod o tom, jak si dvě velice blízké oblasti často nerozumějí - prof. Ing. Jiří Holčík, CSc. (IBA MU) 9:00 9:15 přestávka 9:15 10:45 Vzorkování - prof. Ing. Jiří Holčík, CSc. (IBA MU) 10:45 11:00 přestávka 11:00 12:30 Lineární systémy a modely časových řad - Ing. Daniel Schwarz, Ph.D. (IBA MU) 12:30 14:00 oběd 14:00 15:30 Predikce - Ing. Daniel Schwarz, Ph.D., prof. Ing. Jiří Holčík, CSc., RNDr. Jiří Jarkovský, Ph.D., Mgr. Klára Kubošová (IBA MU) 15:30 15:45 přestávka 15:45 17:00 Korelace - prof. Ing. Jiří Holčík, CSc. (IBA MU)

5. LETNÍ ŠKOLA MATEMATICKÉ BIOLOGIE ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ pátek 22. V. 2009 Aplikace 8:00 9:30 Metody analýzy 3-D obrazů z magnetické rezonance v neuropsychiatrickém výzkumu - Ing. Daniel Schwarz, Ph.D. (IBA MU) 9:30 9:45 přestávka 9:45 11:15 Využití metod analýzy obrazů v oftalmologii - Ing. Radim Kolář, Ph.D. (ÚBMI FEKT VUT v Brně) 11:15 12:30 oběd 12:30 14:00 Modelování a analýza signálů v perfúzním zobrazení - Ing. Radovan Jiřík, Ph.D. (ÚBMI FEKT VUT v Brně) 14:00 14:15 přestávka 14:15 15:45 Modelování soft systémů - prof. RNDr. Jiří Hřebíček, CSc. (IBA MU) 16:00 - podvečerní a večerní RAUT na terase se vzduchotechnikou a lampióny

5. LETNÍ ŠKOLA MATEMATICKÉ BIOLOGIE ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ KAPITOLA I. ÚVOD O TOM, JAK SI DVĚ VELICE BLÍZKÉ OBLASTI ČASTO NEROZUMĚJÍ Jiří Holčík INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ

MATEMATICKÁ BIOLOGIE

MATEMATICKÁ BIOLOGIE matematické modelování zpracování signálů

MATEMATICKÁ BIOLOGIE matematické modelování zpracování signálů

MATEMATICKÁ BIOLOGIE matematické modelování DETERMINISTICKÝ zpracování SVĚT signálů NEDETERMINISTICKÝ SVĚT

matematické modelování zpracování signálů

ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT (ZDROJ INFORMACE)

ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT (ZDROJ INFORMACE)

ZÁKLADNÍ KONCEPT K čemu ta informace bude?

ZÁKLADNÍ KONCEPT abychom dokázali říct, co to je za objekt (rozpoznání, klasifikace, ); abychom dokázali posoudit jeho stav (O.K., hypertenze, epilepsie, exitus, úroveň nebezpečí vyplývající z chemického zamoření dané lokality, ); abychom dokázali předpovědět budoucnost objektu (lze léčit a vyléčit, ocenit finanční nároky léčení po dobu přežití, les do 20 let odumře, sociální složení obyvatelstva v daném časovém rozpětí, );

ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT HODNOTÍCÍ VÝROK

ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT HODNOTÍCÍ VÝROK MĚŘENÍ DATA ZPRACOVÁNÍ

ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT HODNOTÍCÍ VÝROK MĚŘENÍ DATA ZPRACOVÁNÍ

ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT HODNOTÍCÍ VÝROK MĚŘENÍ DATA (UŽITEČNÁ SLOŽKA + BALAST) ZPRACOVÁNÍ

ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT HODNOTÍCÍ VÝROK MĚŘENÍ DATA (UŽITEČNÁ SLOŽKA + BALAST) ZPRACOVÁNÍ

ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT HODNOTÍCÍ VÝROK MĚŘENÍ DATA (UŽITEČNÁ SLOŽKA + BALAST) ZPRACOVÁNÍ

ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT PŘÍČINNÝ DETERMINISTICKÝ VZTAH HODNOTÍCÍ VÝROK MĚŘENÍ DATA (UŽITEČNÁ SLOŽKA + BALAST) ZPRACOVÁNÍ

ZÁKLADNÍ KONCEPT PŘÍČINNÝ DETERMINISTICKÝ VZTAH ZAMILOVANÝ GARFIELD MĚŘENÍ DATA (UŽITEČNÁ SLOŽKA + BALAST) ZPRACOVÁNÍ

CÍL L VŠECH V MOŽNÝCH ANALÝZ ODHALIT TEN PŘÍČINNÝ DETERMINISTICKÝ VZTAH NAVZDORY VŠEMU TOMU, CO NÁM M TO ODHALENÍ

ZÁKLADNÍ SCHÉMA ZPRACOVÁNÍ DAT ZPRACOVÁNÍ PŘED ZPRACOVÁNÍ ANALÝZA KLASIFIKACE UČENÍ VOLBA ELEMENTŮ PRO ANALÝZU NASTAVENÍ ROZHODOVACÍHO PRAVIDLA

PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování vzorkovací teorém x plánování experimentů, resp. výběr z populace;

PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu

PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu statická data - vyjadřují stav zdroje bez potřeby popsat jeho dynamiku (zdroj buď není dynamický nebo dynamika není důležitá očekávané změny probíhají pomaleji než důsledky analýzy (i na základě znalosti pouze statického stavu může být predikována budoucnost)

PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu statická data - vyjadřují stav zdroje bez potřeby popsat jeho dynamiku (zdroj buď není dynamický nebo dynamika není důležitá očekávané změny probíhají pomaleji než důsledky analýzy

PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu dynamická data vyjadřují změny stavu zdroje data musí být uspořádána (v čase, prostoru, ještě nějak jinak?) signály, časové řady, ale třeba i obrázky a kino

PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu dynamická data vyjadřují změny stavu zdroje data musí být uspořádána (v čase, prostoru, ještě nějak jinak?) signály, časové řady JAK POPISUJEME DYNAMICKÁ DATA A JEJICH VLASTNOSTI? deterministická x náhodná, vlastnosti náhodných dat rozložení, nezávislost, stacionarita, ergodicita, korelace, kovariance,

PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu primární oblast to je originální vyjádření, jak ta data měříme; sekundární oblast nějak transformovaná data (např. frekvenční vyjádření frekvenční spektrum), ovšem bez ztráty informace (! - lze beze zbytku obnovit původní reprezentaci)

PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu primární oblast to je originální vyjádření, jak ta data měříme; sekundární oblast nějak transformovaná data (např. frekvenční vyjádření frekvenční spektrum amplitudové, fázové nebo výkonové spektrum, časově frekvenční transformace, spektra vyšších řádů)

PŘEDZPRACOVÁNÍ čištění (filtrace) dat odstranění rušení (šumu)(?), resp. zvýraznění užitečné složky jaké máme informace o vlastnostech užitečné, resp. rušivé složky dat? plánování experimentů odstraňování odlehlých vzorků frekvenční separabilita lineárníčasově invariantní frekvenční filtry x Boxova-Jenkinsova terminologie (AR x MA x ARMA x ARIMA x ); korelace užitečné a rušivé složky zprůměrňování (zprůměrování repetičních dat x klouzavé průměry); adaptivní filtrace souhlasná filtrace optimální wienerovská filtrace, Kalmánův filtr

PŘEDZPRACOVÁNÍ redukce dat odstranění redundantní, resp. irelevantní složky dat; vratná redukce dat data lze obnovit polynomiální predikční, interpolační, diferenční algoritmy, kódování s minimální redundancí; nevratná redukce dat toleranční reprezentace dat polynomiální, pomocí řad, časově-frekvenční transformace; Karhunenova-Loévova transformace (rozklad podle vlastních čísel - SVD) teoretický základ analýzy hlavních komponent PCA, analýza nezávislých komponent - ICA;

PŘEDZPRACOVÁNÍ redukce dat odstranění redundantní, resp. irelevantní složky dat; rekonstrukce a doplnění chybějících údajů interpolace polynomiální, rozklad do řad, ; pomocí modelu sledovaného procesu; na základě statistických vlastností; predikce polynomiální extrapolace; predikce pomocí lineárních systémů; pomocí modelu sledovaného procesu; na základě statistických vlastností;

PŘEDZPRACOVÁNÍ redukce dat odstranění redundantní, resp. irelevantní složky dat; rekonstrukce a doplnění chybějících údajů interpolace polynomiální, rozklad do řad, ; pomocí modelu sledovaného procesu; na základě statistických vlastností; predikce zvláštní disciplina na jedné straně souvisí s rekonstrukcí, na druhé straně je jí třeba při redukci dat, na třetí často se tento pojem plete i do klasifikace (opravdu?)

ANALÝZA Analýza (z řečtiny rozbor, rozčlenění) je metoda založená na dekompozici celku na elementární části. Cílem analýzy je identifikovat podstatné a nutné vlastnosti elementárních částí celku, poznat jejich podstatu a zákonitosti.

ANALÝZA Analýza (z řečtiny rozbor, rozčlenění) je metoda založená na dekompozici celku na elementární části. Cílem analýzy je identifikovat podstatné a nutné vlastnosti elementárních částí celku, poznat jejich podstatu a zákonitosti. URČENÍ VÝZNAMNÝCH POPISNÝCH ELEMENTŮ (proměnných - příznaků, strukturálních prvků) volba - co vůbec zjišťovat a čím se přitom řídit např. na základě empirie, ale třeba i pomocí matematických modelů; výběr - jak si vybrat to nejlepší z toho, co jsme zvolili;

výběr příznaků ANALÝZA určují se vhodné příznakové proměnné selekce nalezení těch příznakových funkcí, které nejvíc přispívají k separabilitě klasifikačních (diagnostických, ) tříd (používané míry, algoritmy, );

výběr příznaků ANALÝZA určují se vhodné příznakové proměnné selekce nalezení těch příznakových funkcí, které nejvíc přispívají k separabilitě klasifikačních (diagnostických, ) tříd (používané míry, algoritmy, ); extrakce - transformace původních příznakových proměnných na jiné informativnější proměnné PCA, ICA, Fisherův algoritmus, faktorová analýza

KLASIFIKACE zařazení do diagnostických kategorií klasifikace podle diskriminačních funkcí příznakové x strukturální klasifikátory s učitelem x bez učitele

KLASIFIKACE zařazení do diagnostických kategorií klasifikace podle diskriminačních funkcí příznakové x strukturální klasifikátory s učitelem (známe klasifikační třídy) paralelní klasifikace bayesovské klasifikátory minimálnístřední ztráta, minimální pravděpodobnosti chyby, maximální aposteriorní pravděpodobnosti; fuzzy klasifikátory klasifikace podle minimální vzdálenosti jaké? metriky mezi obrazy, mezi třídami algoritmus podpůrných vektorů (SVM); neuronové sítě

KLASIFIKACE zařazení do diagnostických kategorií klasifikace podle diskriminačních funkcí příznakové x strukturální klasifikátory s učitelem (známe klasifikační třídy) sekvenční klasifikace Waldovo, Reedovo kritérium klasifikační stromy lesy

KLASIFIKACE zařazení do diagnostických kategorií klasifikace podle diskriminačních funkcí příznakové x strukturální klasifikátory bez učitele (klasifikační třídy neznáme) shlukování hierarchické (aglomerativní, divizivní); nehierarchické (optimalizační zachovávající počet shluků, s proměnným počtem shluků; neoptimalizační)

učení klasifikátorů KLASIFIKACE určovánívlastností(pravděpodobnostních, fuzzy, ) dat hustoty pravděpodobnosti, apriorní pravděpodobnosti, míry příslušnosti; učení neuronových sítí

učení klasifikátorů KLASIFIKACE určovánívlastností(pravděpodobnostních, fuzzy, ) dat hustoty pravděpodobnosti, apriorní pravděpodobnosti, míry příslušnosti;; učení neuronových sítí hodnocení kvality klasifikátorů senzitivita, specificita, prediktivita, ROC charakteristiky

CO S TÍM? T

CO S TÍM? T NAUČME SE ROZUMĚT SI NAVZÁJEM