ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz
5. LETNÍ ŠKOLA MATEMATICKÉ BIOLOGIE ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ čtvrtek 21. V. 2009 Mezidruhová komunikace aneb jak rozumět některým pojmům Aplikace pátek 22. V. 2009 studentská soutěž sobota 23. V. 2009
5. LETNÍ ŠKOLA MATEMATICKÉ BIOLOGIE ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ čtvrtek 21. V. 2009 Mezidruhová komunikace aneb jak rozumět některým pojmům 8:15 9:00 Úvod o tom, jak si dvě velice blízké oblasti často nerozumějí - prof. Ing. Jiří Holčík, CSc. (IBA MU) 9:00 9:15 přestávka 9:15 10:45 Vzorkování - prof. Ing. Jiří Holčík, CSc. (IBA MU) 10:45 11:00 přestávka 11:00 12:30 Lineární systémy a modely časových řad - Ing. Daniel Schwarz, Ph.D. (IBA MU) 12:30 14:00 oběd 14:00 15:30 Predikce - Ing. Daniel Schwarz, Ph.D., prof. Ing. Jiří Holčík, CSc., RNDr. Jiří Jarkovský, Ph.D., Mgr. Klára Kubošová (IBA MU) 15:30 15:45 přestávka 15:45 17:00 Korelace - prof. Ing. Jiří Holčík, CSc. (IBA MU)
5. LETNÍ ŠKOLA MATEMATICKÉ BIOLOGIE ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ pátek 22. V. 2009 Aplikace 8:00 9:30 Metody analýzy 3-D obrazů z magnetické rezonance v neuropsychiatrickém výzkumu - Ing. Daniel Schwarz, Ph.D. (IBA MU) 9:30 9:45 přestávka 9:45 11:15 Využití metod analýzy obrazů v oftalmologii - Ing. Radim Kolář, Ph.D. (ÚBMI FEKT VUT v Brně) 11:15 12:30 oběd 12:30 14:00 Modelování a analýza signálů v perfúzním zobrazení - Ing. Radovan Jiřík, Ph.D. (ÚBMI FEKT VUT v Brně) 14:00 14:15 přestávka 14:15 15:45 Modelování soft systémů - prof. RNDr. Jiří Hřebíček, CSc. (IBA MU) 16:00 - podvečerní a večerní RAUT na terase se vzduchotechnikou a lampióny
5. LETNÍ ŠKOLA MATEMATICKÉ BIOLOGIE ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ KAPITOLA I. ÚVOD O TOM, JAK SI DVĚ VELICE BLÍZKÉ OBLASTI ČASTO NEROZUMĚJÍ Jiří Holčík INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
MATEMATICKÁ BIOLOGIE
MATEMATICKÁ BIOLOGIE matematické modelování zpracování signálů
MATEMATICKÁ BIOLOGIE matematické modelování zpracování signálů
MATEMATICKÁ BIOLOGIE matematické modelování DETERMINISTICKÝ zpracování SVĚT signálů NEDETERMINISTICKÝ SVĚT
matematické modelování zpracování signálů
ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT (ZDROJ INFORMACE)
ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT (ZDROJ INFORMACE)
ZÁKLADNÍ KONCEPT K čemu ta informace bude?
ZÁKLADNÍ KONCEPT abychom dokázali říct, co to je za objekt (rozpoznání, klasifikace, ); abychom dokázali posoudit jeho stav (O.K., hypertenze, epilepsie, exitus, úroveň nebezpečí vyplývající z chemického zamoření dané lokality, ); abychom dokázali předpovědět budoucnost objektu (lze léčit a vyléčit, ocenit finanční nároky léčení po dobu přežití, les do 20 let odumře, sociální složení obyvatelstva v daném časovém rozpětí, );
ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT HODNOTÍCÍ VÝROK
ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT HODNOTÍCÍ VÝROK MĚŘENÍ DATA ZPRACOVÁNÍ
ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT HODNOTÍCÍ VÝROK MĚŘENÍ DATA ZPRACOVÁNÍ
ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT HODNOTÍCÍ VÝROK MĚŘENÍ DATA (UŽITEČNÁ SLOŽKA + BALAST) ZPRACOVÁNÍ
ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT HODNOTÍCÍ VÝROK MĚŘENÍ DATA (UŽITEČNÁ SLOŽKA + BALAST) ZPRACOVÁNÍ
ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT HODNOTÍCÍ VÝROK MĚŘENÍ DATA (UŽITEČNÁ SLOŽKA + BALAST) ZPRACOVÁNÍ
ZÁKLADNÍ KONCEPT REÁLNÝ OBJEKT PŘÍČINNÝ DETERMINISTICKÝ VZTAH HODNOTÍCÍ VÝROK MĚŘENÍ DATA (UŽITEČNÁ SLOŽKA + BALAST) ZPRACOVÁNÍ
ZÁKLADNÍ KONCEPT PŘÍČINNÝ DETERMINISTICKÝ VZTAH ZAMILOVANÝ GARFIELD MĚŘENÍ DATA (UŽITEČNÁ SLOŽKA + BALAST) ZPRACOVÁNÍ
CÍL L VŠECH V MOŽNÝCH ANALÝZ ODHALIT TEN PŘÍČINNÝ DETERMINISTICKÝ VZTAH NAVZDORY VŠEMU TOMU, CO NÁM M TO ODHALENÍ
ZÁKLADNÍ SCHÉMA ZPRACOVÁNÍ DAT ZPRACOVÁNÍ PŘED ZPRACOVÁNÍ ANALÝZA KLASIFIKACE UČENÍ VOLBA ELEMENTŮ PRO ANALÝZU NASTAVENÍ ROZHODOVACÍHO PRAVIDLA
PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování vzorkovací teorém x plánování experimentů, resp. výběr z populace;
PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu
PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu statická data - vyjadřují stav zdroje bez potřeby popsat jeho dynamiku (zdroj buď není dynamický nebo dynamika není důležitá očekávané změny probíhají pomaleji než důsledky analýzy (i na základě znalosti pouze statického stavu může být predikována budoucnost)
PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu statická data - vyjadřují stav zdroje bez potřeby popsat jeho dynamiku (zdroj buď není dynamický nebo dynamika není důležitá očekávané změny probíhají pomaleji než důsledky analýzy
PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu dynamická data vyjadřují změny stavu zdroje data musí být uspořádána (v čase, prostoru, ještě nějak jinak?) signály, časové řady, ale třeba i obrázky a kino
PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu dynamická data vyjadřují změny stavu zdroje data musí být uspořádána (v čase, prostoru, ještě nějak jinak?) signály, časové řady JAK POPISUJEME DYNAMICKÁ DATA A JEJICH VLASTNOSTI? deterministická x náhodná, vlastnosti náhodných dat rozložení, nezávislost, stacionarita, ergodicita, korelace, kovariance,
PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu primární oblast to je originální vyjádření, jak ta data měříme; sekundární oblast nějak transformovaná data (např. frekvenční vyjádření frekvenční spektrum), ovšem bez ztráty informace (! - lze beze zbytku obnovit původní reprezentaci)
PŘEDZPRACOVÁNÍ převod z původní analogové reprezentace do číslicové - vzorkování způsob vyjádření - primární vs. sekundární oblast popisu primární oblast to je originální vyjádření, jak ta data měříme; sekundární oblast nějak transformovaná data (např. frekvenční vyjádření frekvenční spektrum amplitudové, fázové nebo výkonové spektrum, časově frekvenční transformace, spektra vyšších řádů)
PŘEDZPRACOVÁNÍ čištění (filtrace) dat odstranění rušení (šumu)(?), resp. zvýraznění užitečné složky jaké máme informace o vlastnostech užitečné, resp. rušivé složky dat? plánování experimentů odstraňování odlehlých vzorků frekvenční separabilita lineárníčasově invariantní frekvenční filtry x Boxova-Jenkinsova terminologie (AR x MA x ARMA x ARIMA x ); korelace užitečné a rušivé složky zprůměrňování (zprůměrování repetičních dat x klouzavé průměry); adaptivní filtrace souhlasná filtrace optimální wienerovská filtrace, Kalmánův filtr
PŘEDZPRACOVÁNÍ redukce dat odstranění redundantní, resp. irelevantní složky dat; vratná redukce dat data lze obnovit polynomiální predikční, interpolační, diferenční algoritmy, kódování s minimální redundancí; nevratná redukce dat toleranční reprezentace dat polynomiální, pomocí řad, časově-frekvenční transformace; Karhunenova-Loévova transformace (rozklad podle vlastních čísel - SVD) teoretický základ analýzy hlavních komponent PCA, analýza nezávislých komponent - ICA;
PŘEDZPRACOVÁNÍ redukce dat odstranění redundantní, resp. irelevantní složky dat; rekonstrukce a doplnění chybějících údajů interpolace polynomiální, rozklad do řad, ; pomocí modelu sledovaného procesu; na základě statistických vlastností; predikce polynomiální extrapolace; predikce pomocí lineárních systémů; pomocí modelu sledovaného procesu; na základě statistických vlastností;
PŘEDZPRACOVÁNÍ redukce dat odstranění redundantní, resp. irelevantní složky dat; rekonstrukce a doplnění chybějících údajů interpolace polynomiální, rozklad do řad, ; pomocí modelu sledovaného procesu; na základě statistických vlastností; predikce zvláštní disciplina na jedné straně souvisí s rekonstrukcí, na druhé straně je jí třeba při redukci dat, na třetí často se tento pojem plete i do klasifikace (opravdu?)
ANALÝZA Analýza (z řečtiny rozbor, rozčlenění) je metoda založená na dekompozici celku na elementární části. Cílem analýzy je identifikovat podstatné a nutné vlastnosti elementárních částí celku, poznat jejich podstatu a zákonitosti.
ANALÝZA Analýza (z řečtiny rozbor, rozčlenění) je metoda založená na dekompozici celku na elementární části. Cílem analýzy je identifikovat podstatné a nutné vlastnosti elementárních částí celku, poznat jejich podstatu a zákonitosti. URČENÍ VÝZNAMNÝCH POPISNÝCH ELEMENTŮ (proměnných - příznaků, strukturálních prvků) volba - co vůbec zjišťovat a čím se přitom řídit např. na základě empirie, ale třeba i pomocí matematických modelů; výběr - jak si vybrat to nejlepší z toho, co jsme zvolili;
výběr příznaků ANALÝZA určují se vhodné příznakové proměnné selekce nalezení těch příznakových funkcí, které nejvíc přispívají k separabilitě klasifikačních (diagnostických, ) tříd (používané míry, algoritmy, );
výběr příznaků ANALÝZA určují se vhodné příznakové proměnné selekce nalezení těch příznakových funkcí, které nejvíc přispívají k separabilitě klasifikačních (diagnostických, ) tříd (používané míry, algoritmy, ); extrakce - transformace původních příznakových proměnných na jiné informativnější proměnné PCA, ICA, Fisherův algoritmus, faktorová analýza
KLASIFIKACE zařazení do diagnostických kategorií klasifikace podle diskriminačních funkcí příznakové x strukturální klasifikátory s učitelem x bez učitele
KLASIFIKACE zařazení do diagnostických kategorií klasifikace podle diskriminačních funkcí příznakové x strukturální klasifikátory s učitelem (známe klasifikační třídy) paralelní klasifikace bayesovské klasifikátory minimálnístřední ztráta, minimální pravděpodobnosti chyby, maximální aposteriorní pravděpodobnosti; fuzzy klasifikátory klasifikace podle minimální vzdálenosti jaké? metriky mezi obrazy, mezi třídami algoritmus podpůrných vektorů (SVM); neuronové sítě
KLASIFIKACE zařazení do diagnostických kategorií klasifikace podle diskriminačních funkcí příznakové x strukturální klasifikátory s učitelem (známe klasifikační třídy) sekvenční klasifikace Waldovo, Reedovo kritérium klasifikační stromy lesy
KLASIFIKACE zařazení do diagnostických kategorií klasifikace podle diskriminačních funkcí příznakové x strukturální klasifikátory bez učitele (klasifikační třídy neznáme) shlukování hierarchické (aglomerativní, divizivní); nehierarchické (optimalizační zachovávající počet shluků, s proměnným počtem shluků; neoptimalizační)
učení klasifikátorů KLASIFIKACE určovánívlastností(pravděpodobnostních, fuzzy, ) dat hustoty pravděpodobnosti, apriorní pravděpodobnosti, míry příslušnosti; učení neuronových sítí
učení klasifikátorů KLASIFIKACE určovánívlastností(pravděpodobnostních, fuzzy, ) dat hustoty pravděpodobnosti, apriorní pravděpodobnosti, míry příslušnosti;; učení neuronových sítí hodnocení kvality klasifikátorů senzitivita, specificita, prediktivita, ROC charakteristiky
CO S TÍM? T
CO S TÍM? T NAUČME SE ROZUMĚT SI NAVZÁJEM