Projekt grant AV ČR 1.1.2005-31.12.2006 představení výsledků MOÚ, IBA, ÚVT
Osnova prezentace Motivace u Shrnutí hlavních výsledků u Ilustrace hlavních výsledků pomocí živých ukázek práce s nástrojem UIR Shrnutí přínosů u Vize a další kroky 2
Motivace 3
Motivace Rozhovor prof. Vyzuly a doc. Račanského při cestě autem Prof. Vyzula: O pacientech máme hodně dat, ale když pacienta ošetřujeme, tak se k nim nemůžeme snadno a rychle dostat. A tak většinou léčíme, jako kdyby tato data nebyla a soustředíme se pouze na pacientův poslední záznam. Doc. Račanský: Tak s tím něco zkusíme udělat 4
Motivace - vysvětlení Co brání snadné dostupnosti dat? nutnost vědět KDE se ptát (data jsou roztroušena v řadě datových zdrojů NIS, LAB, DB, DWH,...) nutnost vědět JAK se ptát (každý systém se ovládá trochu jinak) nutnost manuálně extrahovat z odpovědi informace relevantní pro danou situaci (oddělovat zrno od plev) Dodatek doc. Duška data jsou často v tak špatné kvalitě, že je potřeba s nimi nejprve něco udělat před spuštěním analýz (příměr: Ferrari zasazené uprostřed oraniště) 5
Jaké je tedy východisko? Potřebujeme takové nástroje, které budou komplexně podporovat práci analytiků lékařů, a které je nebudou odrazovat bariérou technickoorganizačních znalostí potřebných k jejich efektivnímu využití. Takovými nástroji jsou Znalostní a Informační Roboti. Třída těchto nástrojů je defionována následujícími devíti schopnostmi/vlastnostmi: 6
Znalostní a Informační Roboti Schopnost komunikovat v přirozeném jazyce Deklarativní pojmový systém Deklarativní specifikace chování Schopnost přehledně prezentovat data Schopnost organizovat Schopnost přistupovat k různým druhům datových zdrojů Schopnost adaptovat se na aktuální situaci Schopnost vědět co ví Schopnost zaměřovat a distribuovat pozornost 7
Universální Informační Robot (UIR) SW nástroj s prvky umělé inteligence Intelekt Paměť učení pravidla zaměřená především na zapamatování vztahů Komunikace - uživatelské rozhraní myšlenkové mapy, tabule, terminál přirozeného jazyka, formulář předdefinované operace 8
= UIR v ONkologii Cíle Prověřit přínosy takovéto technologie v oblasti onkologie Naučit UIRa potřebné pojmy a souvislosti Naučit UIRa potřebná pravidla Prototypově ho vyzkoušet na reálných datech a problémech 9
Shrnutí hlavních výsledků 10
Pacient středobod zájmu... Data pojišťoven Klinická data Epidemiologické pozadí Experimentální data Epidemiologická data 11
Prototypově ověřené oblasti (1) Práce s klinickými daty práce s parametrickou dokumentací onkologického pacienta (PDOP) propojení s externími službami (portál WebSVOD) Práce s epidemiologickými daty validace dat (data NOR) posun v čase (data NOR) 12
Prototypově ověřené oblasti (2) Práce s experimentálními daty průvodce analýzou microarray sklíčka s využitím služeb specializovaného analytického nástroje (hledání alterovaných genů metodami GLAD a DNAcopy pomocí nástroje R) správce výsledků analýz v kontextu klinických dat Snadné zpřístupnění dat z datového skladu vyhledání relevantního reportu podle informace z jeho obsahu 13
Prototypově ověřené oblasti (3) TNM asistent poskytnutí robotovy znalosti TNM klasifikace přes portál WebSVOD 14
Ilustrace hlavních výsledků 15
Práce s klinickými daty (1) Motivace zpřístupnění netradičních pohledů na pacienta lékařům zjednodušení analýz nad klinickými daty propojení klinických dat s daty z jiných datových zdrojů (PACS, WebSVOD, data pojišťoven, NIS,...) V této části se pracuje s daty parametrické dokumentace onkologického pacienta (PDOP) s grafy dynamicky získanými z portálu WebSVOD 16
Legenda: léčebné fáze a modality primární diagnostika farmakoterapie primární léčba chemoterapie dispenzární péče radioterapie léčba progrese operace léčba relapsu 26
Legenda: léčebné výkony diagnostické výkony chemoterapie radioterapie chirurgické výkony jiné léčebné výkony 29
Práce s klinickými daty (2) Přínosy data o pacientovi zpřístupněna lékaři dle jeho volby, aniž by lékař musel znát, kde se požadovaná data nacházejí různé formy prezentace dat (myšlenkové mapy, časové tabule, formuláře) propojení různých datových zdrojů (NIS, PACS, WebSVOD) odvozování nových souvislostí, které přímo neobsahuje žádný z datových zdrojů 36
Práce s klinickými daty (3) Závěry prověřili jsme, že UIR může zprostředkovat odlišný pohled na klinická data. Bude však potřeba zlepšit mechanismus vizualizace kombinovat jednotlivé vizualizační formy podle aktuální situace prověřili jsme, že UIRa lze použít pro integraci klinických dat z různých datových zdrojů, dat pojišťoven a epidemiologických dat ukázali jsme, jak lze tohoto propojení využít pro získání nových informací 37
Práce s epidemiologickými daty (1) Motivace výběr dat z epidemiologických registrů podle pravidel definovaných lékaři lepší využití nasbíraných epidemiologických dat a možnost kvalitnější analýzy zjišťování příčin nekonzistence dat pro zlepšování metod sběru dat do registrů v budoucnosti V ukázce z této oblasti se pracuje s daty Národního Onkologického Registru (NOR) s pravidly TNM klasifikace, která byl UIR naučen 38
Pravidlo definované lékařem Pravidlo kontrolující lateralitu záznamu u nádoru nesmí být lateralita odpadá, pokud se u diagnózy lateralita určuje; u diagnóz nepárových orgánů musí být lateralita odpadá 39
Proces validace NOR 40
41
42
43
Práce s epidemiologickými daty (2) Posun v čase (více v Detailu) transformace dat pomocí pravidel za účelem přenesení se do minulosti ověřeno nad daty NOR Přínosy práce s epidemiologickými daty lepší využití dat pro klinickou praxi a výzkum validace dat kvalitnější benchmarking zlepšení procesu sběru dat 44
DETAIL: Historka: Posun v čase Možnost pohledu na data tak, jak vypadala v minulosti Konkrétně: NOR ve stavu 2003 s posunem na konec roku 1995 To znamená: pacienti zemřelí po roce 1995 ještě žijí nemoci diagnostikované u pacientů po roce 1995 nejsou zaznamenány...
Možnosti využití Analýza dat k libovolnému požadovanému časovému okamžiku od nyní do minulosti Aplikace klasifikačních pravidel platných v daném časovém okamžiku, pokud to zaznamenaná data umožňují Statistiky nad takto modifikovanými daty Výpočet trendů a jejich ověřování
Způsob práce Robot se naučí sadu pravidel Data NORu jsou dle těchto pravidel převedena do stavu, v jakém byla k určenému časovému okamžiku, tzn. tak, jak data vypadala např. na konci roku 1995
Pravidla, která vyplývají z časového posunu z roku 2003 do roku 1995 (1) Pacienty, kteří v roce 1995 nebyli ještě narozeni, vyjmout z dat Pacienty, kteří v roce 1995 ještě žili (oproti roku 2003), vést jako živé Onemocnění, která byla diagnostikována po roce 1995, z dat odstranit Léčebné kroky provedené po roce 1995 odstranit z dat
Pravidla, která vyplývají z časového posunu z roku 2003 do roku 1995 (2) Atributy vážící se k časovým hodnotám adekvátně modifikovat Reklasifikovat stav onemocnění pokud je to možné
Práce s epidemiologickými daty (3) Závěry prokázali jsme, že nástroj UIR lze využít pro zlepšení kvality dat prokázali jsme, že nástroj UIR je vhodný doplněk běžných analytických nástrojů, protože umožňuje dělat s daty běžně nedostupné operace 52
Práce s experimentálními daty (1) Motivace zprostředkování funkčnosti statistických a analytických nástrojů pomocí nástroje UIR správa výsledků analýz provedených externími nástroji V ukázce se pracuje s reálnými genetickými daty jednoho pacienta (microarray sklíčko) prostřednictvím robota s analytickým nástrojem R 53
Microarrays (1) V současnosti jedna z nejrozšířenějších technologií pro analýzu genomu a to na úrovni struktury DNA i na úrovni exprese genů 54
Microarrays (2) Schopnost analyzovat tisíce genů v jednom experimentu Významný prostředek v diagnostice, epidemiologii či třídění nádorových onemocnění ve vědeckých studiích V blízké budoucnosti využití analýzy map genové exprese jako diagnostického prostředku přímo v klinické praxi 55
Microarray experiment: analýza bez pomoci robota NCBI 56
Microarray experiment: analýza s pomocí robota 57
Microarray experiment: analýza s pomocí robota 58
59
60
61
62
Úprava datového souboru (1) 1) Oddělit popisnou část od 2) Sjednotit datovou část datové části.gpr souboru souboru se souborem s pozicemi klonů na genomu 3) Úprava sjednoceného datového souboru oddělení označených spotů na základě hodnot proměnných Flags 4) Odhad hodnot exprese pro jednotlivé klony 63
Úprava datového souboru (2) Délka zpracování práce s Excelem + R práce s Excelem + Clementine práce s robotem cca 1 hod cca 1 hod cca 1 min Časová redukce z řádu hodin na řády minut 64
Microarray experiment: analýza s pomocí robota 65
66
67
68
69
Microarray experiment: analýza s pomocí robota 70
71
72
73
Microarrays - interpretace (1) Na klinické úrovni na základě nalezeného genetického profilu se robot spojí s externí databází obsahující informace o funkci kódovaných produktů aberovaných genů a tuto informaci spojí s výsledky již publikovaných studií a použije pro interpretaci výsledků, např.: pacient s touto genovou aberací s vysokou pravděpodobností neodpoví na danou terapii přežití pacientů s tímto genetickým profilem je méně než 5 let u pacientů s takovou genetickou aberací se s vysokou pravděpodobností dostaví do dvou let relaps 74
Microarrays - interpretace (2) Na úrovni vědecké studie po spojení výsledků všech pacientů v studii můžeme pomocí robota nasadit různé vícerozměrné metody a podle cílů studie nalézt: nové podskupiny nádoru genetický profil pacientů, který neodpovídá na terapii... 75
Práce s experimentálními daty (2) Přínosy používání různých statistických a analytických metod jednotným způsobem bez nutnosti znát nástroje, které tyto metody aplikují řádové zrychlení přípravy i analýzy dat výsledky analýz jsou robotem evidovány a je možno s nimi dále pracovat (více v Detailu) 76
DETAIL 77
78
79
80
81
82
Práce s experimentálními daty (3) Závěry prokázali jsme, že robot umožňuje zjednodušit lékaři přístup ke službám specializovaných nástrojů prokázali jsme, že robot může dramaticky urychlit práci s těmito nástroji prokázali jsme, že robot může výrazně zjednodušit (po technické stránce) zavádění nových diagnostických postupů do klinické praxe 83
Snadné zpřístupnění dat z datového skladu (1) Motivace vyhledávání a zobrazování reportů problém: vím jaké informace hledám, ale nevím jak se jmenuje příslušný report a kde jej najdu řešení: vyhledávání reportu pomocí jeho obsahu V ukázce se pracuje s demonstračním webovým formulářem s demonstračními reporty datového skladu BEE (technologie použitá při budování datového skladu MOÚ) 84
85
86
87
88
Snadné zpřístupnění dat z datového skladu (2) Přínosy stačí vědět co chci není potřeba vědět kde, jak a pod jakým názvem relevantní report najdu dotaz na report v přirozeném jazyce uživatelsky jednoduché formou vyhledávače (např. Google) 89
Snadné zpřístupnění dat z datového skladu (3) Závěry prokázali jsme, že UIR může pomoci překonat bariéru běžných uživatelů ve využívání dat z datových skladů 90
TNM asistent (1) Motivace určité druhy medicínských postupů jsou standardizovány asistent může být průvodcem těmito standardy takovým standardem je TNM klasifikace nádorů, v periodicky aktualizovaných vydáních V ukázce se pracuje s webovým rozhraním zpřístupňujícím služby robota, který byl naučen TNM klasifikacím webové rozhraní je součástí portálu WebSVOD 91
92
93
94
95
96
97
98
99
100
TNM asistent (2) Přínosy zpřístupnění TNM klasifikace lékařům pro potřeby odvozování a validace stádií onkologických onemocnění edukační nástroj snadné rozšíření o další vydání TNM klasifikace použití TNM klasifikace pro validaci jiných datových souborů (např. NOR) 101
TNM asistent (3) Závěry prokázali jsme, že UIRa lze naučit komplexní oblast onkologických znalostí (soustavu několika tisíců pravidel pro klasifikaci nádorů a určování stádia onemocnění) prokázali jsme, že takto naučenou znalost lze používat pro validaci stávajících dat odvozování nových či chybějících skutečností edukaci 102
Přínosy u 103
Přínosy u (1) Prokázali jsme, že nástroj druhu UIR lze úspěšně použít pro snadnější přístup k datům lékaři, který se nemusí starat o to KDE jsou data uložena, JAK se ovládají jednotlivé systémy a jak z jednotlivých střípků informací skládat celkový obraz získání nových informací propojením nyní oddělených dat formalizaci znalostí z oblasti onkologie zpřístupnění služeb analytických nástrojů 104
Přínosy u (2) Díky tomu lze zkvalitnit zdravotní péči informace pro rozhodování jsou snadno přístupné snížit náklady na zdravotní péči lze omezit počet zbytečně realizovaných vyšetření snížit náklady na vývoj a údržbu IT nástrojů robot se neprogramuje, pouze učí 105
Vize a další kroky 106
Stav dnes 107
Stav zítra 108
Proč je potřeba nástroje druhu UIR? (1) Adaptace na konkrétního lékaře lékař nechce, aby mu nástroj nabízel spoustu cest jak se dostat k potřebným informacím lékař chce cestu jednu pro každého lékaře však jde o jinou cestu o tom, jaká je to cesta se však lékař nechce bavit s informatiky Nástroj se musí adaptovat automaticky, pouze na základě toho, zda je lékař s výsledkem spokojen nebo není (evoluční principy) 109
Proč je potřeba nástroje druhu UIR? (2) Adaptace na měnící se infrastrukturu struktura datových zdrojů se stále mění objevují se nové datové zdroje (databáze léčiv a jejich interakcí, portály,...) objevují se nová vydání standardů (např. TNM klasifikace, guidelines,...) zdravotnická zařízení se vzájemně propojují (např. vzniká síť center onkologické péče) Nástroj musí být na měnící se prostředí rychle a levně adaptovatelný 110
- závěr Prokázali jsme, že zvolená cesta je smysluplná a budeme touto cestou dále kráčet v nově založené Laboratoři Znalostních a Informačních Robotů na Fakultě Informatiky Masarykovy University v nově založené firmě AdvaICT (spin-off Masarykovy University), jejímž cílem je dotažení řešení do praxe 111