Dobývání znalostí z databází (MI-KDD) Přednáška číslo 5 Zajímavé dvojice podmnožin objektů, procedura SD4ft-Miner

Podobné dokumenty
Dobývání znalostí z databází (MI-KDD) Přednáška číslo 9 Využití doménových znalostí

Analytické procedury v systému LISp-Miner

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 4 Asociační pravidla

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ PŘÍKLADY APLIKACÍ V KARDIOLOGICKÝCH DATECH Jan Rauch

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 1 - Úvod

Úvod do dobývání. znalostí z databází

Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 2. Projekt LISp-Miner.

Výpočet na gridu a LM TaskPooler

Vysoká škola ekonomická. Katedra informačního a znalostního inženýrství. Fakulta informatiky a statistiky. Systém LISp-Miner

Základy vytěžování dat

Trendy v časových oknech jako rizikové faktory kardiovaskulárního onemocnění

LISp-Miner: systém pro získávání znalostí z dat 1

OR Biomedicínská informatika

Projekt LISp-Miner. M. Šimůnek

nské informatice Prof. RNDr. Jana Zvárová, DrSc. informatiku, nské informatiky Ústav informatiky AV ČR R v.v.i.

OR Biomedicínská informatika

prof. RNDr. Čestmír Burdík DrCs. prof. Ing. Edita Pelantová CSc. BI-ZMA ZS 2009/2010


INNO-MED. Vývoj informačního systému medicíny založené na důkazu pro zlepšení kvality lékařské péče Přehled výsledků řešení

Dolování asociačních pravidel

OSOBNÍ ANGAŽOVANOST SOCIÁLNÍHO PRACOVNÍKA

Startovní úloha Samostatná práce

Zápis ze 3. zasedání VR ze dne

Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE

Pokyny pro zpracování BP - Optometrie

Děkan: prof. MUDr. Zdeněk Kolář, CSc. Úřední hodiny: Út: 13:00 14:00 hod Čt: 13:00 15:00 hod

D Studijní plán oboru Vysoká škola Součást vysoké školy Název studijního programu Název studijního oboru

STULONG. Datamining. zápočtová analýza č. 1

Rozvojový projekt na rok 2011

Cílový tlak během anestezie

Asociační pravidla (metoda GUHA)

Výuka telemedicíny a ehealth na 1. LF Univerzity Karlovy v Praze Centrum podpory aplikačních výstupů a spin-off firem 1. L F U K

Studijní obor Management zdravotnictví na LF UP v Olomouci

OPTIMED. Komparativní analýza. Konference Optimed 17. Října Julie Bienertová-Vašků. Optimalizovaná výuka

Besedy pro zdraví Rakovina není náhoda

PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITY PALACKÉHO KATEDRA INFORMATIKY DIPLOMOVÁ PRÁCE. Analýza dat ze studentských dotazníků Bc.

Soulad studijního programu. Aplikovaná informatika

Aplikace asociačních pravidel ve společnosti Zinest s.r.o.

EXPERIMENTÁLNÍ GUHA PROCEDURY

Zápis ze 4. zasedání VR ze dne


PROJEV PŘI PŘÍLEŽITOSTI INAUGURACE DĚKANA LÉKAŘSKÉ FAKULTY UNIVERZITY PALACKÉHO V OLOMOUCI

Lékařská. Lékařská chemie a Hudební teorie a pedagogika Dějiny slovanských literatur se zaměřením Dějiny české, polské a ruské literatury

Jaký má být cílový tlak během anestezie?

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Neurologická klinika Stránka 1 z 6

Prof. Ing. Ladislav Buřita, CSc., UTB/FaME Zlín Ing. Pavel Rosman, Ph.D., UTB/FaME Zlín Ass. prof. Zsolt Tóth, University of West Hungary, Sopron

INOVATIVNÍ KURZY IMUNOANALÝZY A ENDOKRINOLOGIE PRO VĚDECKÉ PRACOVNÍKY- PILOTNÍ ZKUŠENOSTI LÉKAŘSKÉ FAKULTY V PLZNI

Hodnocení ISO pro rok 2014 katedra 714


Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) 9. dubna Filip Železný (ČVUT) Vytěžování dat 9.

1) Ústav lékařské informatiky 2.LF UK 2) Ústav výpočetní techniky UK 3) Dětská stomatologická klinika 2.LF UK

KURZ VYBRANÉ PROBLÉMY KOGNITIVNÍ VĚDY (KA 17)

Magisterský program Biomedicínské inženýrství a informatika na ČVUT FEL Praha

Nabídka IT specialistů v ČR

Vybrané kapitoly v péči o pacienty s kardiovaskulárním onemocněním I.

E-LEARNINGOVÁ OPORA PŘEDMĚTU PROGRAMOVÉ VYBAVENÍ ORDINACE ZUBNÍHO LÉKAŘE Kateřina Langová, Jana Zapletalová, Jiří Mazura

PRÁCE NA ÚSEKU HYGIENY A EPIDEMIOLOGIE VE ZDRAVOTNICKÝCH ZAŘÍZENÍ. Certifikovaný kurz akreditovaný MZ ČR. IX. běh 2018 Sídlo Skupiny B.

Vzdělávání v Biomedicínské a Zdravotnické Informatice

Lokální a globální analytické zprávy o výsledcích DZD

Lékařská fakulta. Ostravské university v Ostravě

NÁZEV HABILITAČNÍ PRÁCE: Využití diskriminační analýzy pro predikci budoucího vývoje firmy

OPATŘENÍ DĚKANA č. 17/2018, kterým se vydává příkaz, kterým se mění Organizační řád 3. LF UK. Článek 1 Úvodní ustanovení

HODNOCENÍ ISO PRO ROK 2012 KATEDRA 714

Příloha č. 1 Seznam pracovišť 1. lékařské fakulty Univerzity Karlovy a jejich řádné označení (verze v jazyce českém a verze v jazyce anglickém)

Závěrečná zpráva o výsledcích řešení projektu v rámci rozvojových program MŠMT na rok 2006

Bakalářský studijní obor hospodářská informatika

Anotace. Klíčová slova. Zdravotnický portál pro občany - Dánsko

Závěrečná zpráva projektu č. 148/2003

Sociální síť informatiků v regionech České republiky

UNIVERZITA KARLOVA V PRAZE LÉKAŘSKÁ FAKULTA V HRADCI KRÁLOVÉ. OBĚŽNÍK č. 14

ZÁPIS ze zasedání Vědecké rady LF UK v Plzni ze dne

Informace pro studenty doktorského studijního programu obecná jazykověda a teorie komunikace (OJTK)

Hygiena ve zdravotnických zařízeních a prevence nozokomiálních nákaz

Nová GUHA-procedura ETree-Miner v systému LISp-Miner

PODPOROVÁNO EU. Pozvánka a program. Konference a semináře pro nelékařské obory Onkologická onemocnění. z pohledu ošetřovatelské péče

Základy matematiky pro FEK

Projekt MEFANET. Představení stavu a výsledků projektu. L. Dušek, S. Štípek, V. Mihál, D. Schwarz, Č. Štuka jménem Koordinační rady sítě MEFANET

Křest knihy Experimental Surgery

15. Návrh na přijetí usnesení z jednání vědecké rady a hlasování o návrhu

Konference a semináře pro nelékařské obory Onkologická onemocnění. Osobní záštitu převzal Ing. Jaroslav Palas, hejtman Moravskoslezského kraje

Hodnocení (ne)zajímavosti asociačních pravidel za využití báze znalostí

JUDr. Mgr. Vladimíra Těšitelová. Ústav zdravotnických informací a statistiky ČR

Ing. Miloš Maryška, Ph.D. Seminář VŠE, ČSSI a ICT UNIE

Analýza studijních výsledků a připravenosti nastupujících studentů v oblasti ICT Informatics Education, Preparation and Results of Students

14. března 2016, Brno, hotel Myslivna PROGRAM KONGRESU.

Krevní tlak, prehypertenze, hypertenze a příjem soli

Rozvrh bakalářského studia Všeobecná sestra - kombinovaná forma,

Rozvojový projekt na rok 2009

Univerzita třetího věku pro kolegium děkana

Vědecký tutoriál, část I. A Tutorial. Vilém Vychodil (Univerzita Palackého v Olomouci)

Kategorie PZS: A fakultní a velké nemocnice akutní péče

Znalostní technologie proč a jak?

Studium na katedře informatiky

PILOTNÍ ZKUŠENOSTI S ORGANIZACÍ INOVATIVNÍCH KURZŮ IMUNOANALÝZY A ENDOKRINOLOGIE PRO VĚDECKÉ PRACOVNÍKY NA LÉKAŘSKÉ FAKULTĚ V PLZNI

AKTIVNÍ ZAPOJOVÁNÍ STUDENTŮ DO VÝUKY STATISTIKY A PSYCHOMETRIE: ZKUŠENOSTI Z USA

Základy teorie množin

Studijní program : Všeobecné lékařství. Název předmětu : Epidemiologická metodologie; EBM. Rozvrh výuky : 12 hodin seminářů

Biomedicínská informatika a její úloha v personalizované medicíně. Petr Lesný

Transkript:

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 5 Zajímavé dvojice podmnožin objektů, procedura SD4ft-Miner (c) prof. RNDr. Jan Rauch, CSc. KIZI, Fakulta informatiky a statistiky VŠE zimní semestr 2011/2012 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Zajímavé dvojice podmnožin objektů, procedura SD4ft-Miner Vytvořeno na základě článku J. Rauch, M. Šimůnek: GUHA Method and Granular Computing. In: HU, Xiaohua, LIU, Qing, SKOWRON, Andrzej, LIN, Tsau Young, YAGER, Ronald R., ZANG, Bo (ed.). Proceedings of Granular computing. Piscataway: IEEE, 2005, pp. 630 635. Viz též http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=1547368 2

Zajímavé dvojice podmnožin objektů, procedura SD4ft-Miner Je prezentována GUHA procedura SD4ft-Miner určená pro hledání zajímavých podmnožin objektů reprezentovaných řádky analyzované matice dat. K prezentaci jsou využita medicínská data STULONG. Projekt STULONG byl realizován na II. interní klinice 1. lékařské fakulty Univerzity Karlovy a ve Všeobecné fakultní nemocnice v Praze pod vedením Prof. MUDr. F. Boudíka, DrSc. ve spolupráci s MUDr. M. Tomečkovou, CSc. a Prof. MUDr. J. Bultasem, CSc. Data byla převedena do elektronické podoby Evropským centrem pro medicínskou informatiku, statistiku a epidemiologii Univerzity Karlovy a Akademie věd ČR pod vedením Prof. RNDr. Jany Zvárové,DrSc., viz euromise.vse.cz/challenge2004/. 3

Motivace data STULONG 1417 pacientů, viz http://euromise.vse.cz/challenge2004/data/entry/ 4

Příklady atributů Systolic blood pressure [mm Hg] (systolický krevní tlak) Beer amount / day (množství piva za den) Skinfold_riceps [mm] (kožní řasa na tricepsu) 5

Přehled atributů Body Weight; Skinfold_subscapularis (kožní řasa pod lopatkou); Skinfold_ triceps (kožní řasa na tricepsu) Social characteristics Education; Marital_status; Responsibility_job (zodpovědnost v zaměstnání) Physical activity Activity_job (fyzická aktivita v zaměstnání); Activity_after_job (fyzická aktivita po zaměstnání) Blood pressure systolic, diastolic Alcohol consumption bier, wine, liquers, Group normal, risk, pathological 6

Analytická otázka - příklad Jaké dvojice skupin pacientů (normal, risk, pathological) a za jakých podmínek se v datech STULONG významně liší co se týče vztahu charakteristik těla a výše krevního tlaku? 7

Vztah charakteristik těla a výše krevního tlaku Vyjádření pomocí konfidence asociačního pravidla jednoduchý příklad: Weight(50 60) Systolic(140 160) STULONG a c b d Konfidence asociačního pravidla = Conf( ) = a /(a+b) viz též přednášku o asociačních pravidlech 8

Risk a normal pacienti se liší ohledně Weight(50 60) Systolic(140 160) Princip: Conf( ) pro rizikové pacienty a pro normální pacienty se liší alespoň o 0.4 risk normal a 2 b 2 c 2 d 2 a 2 b 2 c 2 d 2 a 1 /(a 1 +b 1 ) - a 2 /(a 2 +b 2 ) 0.4 a 1 40 a 2 40 9

SD4ft Pattern 1. množina 2. množina SD4ft-kvantifikátor : / antecedent sukcedent podmínka 1. a 2. množina objektů se liší co se týče vztahu antecedentu a sukcedentu pokud je splněna podmínka. Způsob je dán SD4ft-kvantifikátorem. 10

SD4ft Pattern - příklad verifikace v matici dat M M / M / = podmatice matice M skládající se z řádků splňujících = podmatice matice M skládající se z řádků splňujících M M a 1 b 1 c 1 d 1 a 2 b 2 c 2 d 2 Příklad SD4ft-kvantifikátoru: a 1 /(a 1 +b 1 ) - a 2 /(a 2 +b 2 ) 0.4 a 1 40 a 2 40 DiffConf 0.4 a 1 40 a 2 40 11

GUHA procedura SD4ft-Miner Matice dat M Definice množiny relevantních SD4ft - pattern Generování a verifikace jednotlivých relevantních SD4ft - pattern Všechny SD4ft pattern pravdivé v M 12

Množina relevantních SD4ft Pattern Normal / Risk / Pathological 1. množina 2. množina DiffConf 0.4 a 1 40 a 2 40 : / Body(?) Blood presssure(?) Alcohol(?) Jaké dvojice skupin pacientů (normal, risk, pathological) a za jakých podmínek se v datech STULONG významně liší co se týče vztahu charakteristik těla a výše krevního tlaku? 13

Vstup procedury SD4ft-Miner příklad Patient(?) DiffConf 0.4 a 1 40 a 2 40 Blood presssure(?) Normal / Risk / Pathological Alcohol(?) 14

Výstup procedury SD4ft-Miner příklad 52,4 * 10 6 verifikací 17 nalezených SD4ft pattern 35 minut 47 vteřin 2GB RAM, Intel T7200 processor s 2 GHz 15

SD4ft-Miner příklad detailu výstupu 16

SD4ft-Miner komentář k detailu výstupu Antecedent: Skinfold_subscapularis(0-30 University Married Succedent: Diastolic 60-90) Systolic 110-140) První skupina: Normální pacienti Druhá skupina: Rizikoví pacienti Podmínka: Beer- up to 1 litre / day Normální Suc Suc Ant 45 4 Ant 74 32 Rizikoví Suc Suc Ant 45 55 Ant 172 207 a 1 a 1 b 1 45 45 4 0,92 DiffConf = 0.47 a 2 a 2 b 2 45 45 55 0,45 17

Při tvorbě těchto elektronických podkladů pro výuku byly využity výsledky těchto projektů realizovaných na Vysoké škole ekonomické v Praze: Projekt GAČR 201/08/0802 - Aplikace metod znalostního inženýrství při dobývání znalostí z databází Projekt MŠMT ME 913 - Nové nástroje a teorie pro dobývání znalostí z databází 18