Sémantická interoperabilita v biomedicíně a zdravotnictví
|
|
- Irena Zemanová
- před 9 lety
- Počet zobrazení:
Transkript
1 Sémantická interoperabilita v biomedicíně a zdravotnictví Editoři: Štěpán Svačina a Jana Zvárová Podpořeno projektem SVV Fotografie na titulní straně: Karel Meister Grafický návrh: Anna Schlenker
2 2015, Autoři uvedení v textu. Všechna práva vyhrazena. Žádná část sborníku nesmí být kopírována či rozmnožována za účelem dalšího rozšiřování v jakékoliv formě či jakýmkoliv způsobem, ať již mechanickým nebo elektronickým, včetně pořizování fotokopií, nahrávek, informačních databází, bez písemného souhlasu vlastníka autorských práv. Korektury: Mgr. Růžena Písková, Ph.D.
3 Sémantická interoperabilita v biomedicíně a zdravotnictví Prof. MUDr. Štěpán Svačina, DrSc., MBA Prof. RNDr. Jana Zvárová, DrSc. Semináře o sémantické interoperabilitě v biomedicíně a zdravotnictví se staly již pravidelným podzimním fórem, kde prezentují své práce zejména studenti doktorského studijního programu Biomedicínská informatika. Biomedicínská informatika je jedním z nejmladších oborů doktorského studia biomedicíny, které bylo nově koncipováno od 90. let a zahrnuje dnes téměř dvě desítky oborů. Témata publikovaná ve sborníku prací ukazují, že biomedicínská informatika se stala stejně významným oborem, jako jsou klasické medicínské obory doktorského studia, tedy jako je třeba fyziologie, biofyzika nebo neurovědy. Obor biomedicínské informatiky je dnes také oborem pro habilitační a jmenovací řízení. Biomedicínská informatika obor rozvíjející se postupně od 50. let minulého století se tak dnes stal plnohodnotnou součástí medicíny teoretické, klinické i lékařské vědy. Podíváme-li se zpět na šest ročníků semináře, zaznamenáváme vzestupnou úroveň prací a je dobře, že jsou publikovány česky i anglicky, jsou tak přístupné širšímu fóru zdravotnických pracovníků. Sémantická interoperabilita a schopnost získat konkrétní informace při použití technických prostředků jsou základními podmínkami pro využívání technologií telemedicíny v elektronickém zdravotnictví. Schopnost systémů porozumět přenášeným údajům (sémantická interoperabilita) vyžaduje použití stejné terminologie (tj. klasifikačních systémů a číselníků) při použití stejného jazyka pro komunikaci a jeho záznam (datové standardy). Pokud se informace v biomedicíně a zdravotnictví sdílejí pomocí volného textu, předpokladem pro sémantickou interoperabilitu je zjištění jeho významu. Pravděpodobně nejlepší aplikovatelný obecný klasifikační systém pro zdravotnictví je SNOMED CT. Tento systém vznikl spojením amerického systému SNOMED (vytvořený Asociací amerických patologů) a Britské klinické terminologie ( Read codes ). V souvislosti s touto fúzí byla v roce 2007 ustavena International Health Terminology Development Organization (IHTSDO) se sídlem v Dánsku. IHTSDO je neziskové sdružení, které vyvíjí a propaguje používání SNOMED CT pro podporu bezpečné a účinné výměny informací ve zdravotnictví. SNOMED CT je klinická terminologie, která je považována za nejkomplexnější vícejazyčnou terminologii ve zdravotnictví na světě. SNOMED CT je v současné době používán v celé řadě informačních systémů pro zaznamenávání klinických informací do záznamů o pacientech. Obrázek 1: Faustův dům. Ve sborníku semináře Sémantická interoperabilita v biomedicíně a zdravotnictví, konaném 17. září 2015 v Akademickém klubu 1. lékařské fakulty UK ve Faustově domě je publikováno jednadvacet krátkých originálních příspěvků doktorandů v češtině a angličtině. Sborník tak tvoří přehledný doplňující materiál k vlastním přednáškám doktorandů na semináři.
4
5 Část I Česky Sémantická interoperabilita v biomedicíně a zdravotnictví Part I Czech
6
7 1 Obsah 3 5 Management následných vyšetření štítné žlázy v těhotenství Bartáková J., Jiskra J. 6 9 Bezpečnost osobních dat a Big Data v biomedicíně Berger J., Beyr K Role jednonukleotidových polymorfismů v patogenezi vysokostupňových gliomů Bielniková H., Buzrla P., Bielnik O., Tomanová R., Urbanovská I., Hrušková L., DvořáčkováJ., Mazura I O vlastnostech genové konverze Gergelits V Detekce mutací v genech kolagenu typ I Hrušková L Statistické metody pro tvorbu časově závislých percentilových grafů pro hodnocení velikosti plodu a dataci gravidity na základě longitudinálních dat Hynek M., Long J.D., Stejskal D., Zvárová J Význam deficitu cerebrálního folátu pro vývoj a progresi autismu Krsička D., Šárek M Integrace zařízení pro léčbu diabetu a lifestyle zařízení v rámci mobilní aplikace pro self-management diabetu Mužný M., Vlasáková M., Mužík J., Arsand E Porovnávání internetových stránek a lékařských doporučených postupů s využitím databází řízených medicínských slovníků Rak D., Svátek V Mezinárodní komunikační standardy a interoperabilita systémů v českém zdravotnictví Seidl L., Hanzĺıček P Velká data v nemocničních informačních systémech z pohledu bezpečnosti Schlenker A., Reimer M Sekundární katarakta u pacientů po implantaci multifokálních nitroočních čoček Sičová K., Výborný P., Pašta J DNA v biomedicínských aplikacích Slovák D., Zvárová J Nestrukturovaná data ve zdravotnictví založeném na důkazech Stonová M Vývoj převodního systému u myši Šaňková B., Beneš J., Sedmera D Výskyt mikrobiální flóry nosních průchodů a její vliv na rozvoj chronických rhinosinusitid Šteffl M., Plzák J Léčba glaukomu za 1 Kč denně sen nebo realita? Veselá Flórová Z., Výborný P., Sičáková S., Obenberger J Telemonitoring základních terapeutických prvků léčby diabetes mellitus a možnosti jejich hodnocení Vlasáková M., Mužný M., Mužík J Výhody využití virtuálního pacienta v nelékařských zdravotnických oborech Vondrušková L Předzpracování lékařských zpráv pro extrakci informací Zvára K., Tomečková M., Svátek V., Zvárová J Stroma dlaždicobuněčných nádorů hlavy a krku Živicová V., Fík Z., Dvořánková B., Smetana Jr. K. Sémantická interoperabilita v biomedicíně a zdravotnictví
8
9 Bartáková J., Jiskra J. Management následných vyšetření štítné žázy v těhotenství 3 Management následných vyšetření štítné žlázy v těhotenství Jana Bartáková 1,2, Jan Jiskra 1 1 Ústav biofyziky a informatiky, 1. lékařská fakulta, Univerzita Karlova v Praze, Praha, Česká republika 2 3. interní klinika, Všeobecná fakultní nemocnice a 1. lékařská fakulta, Univerzita Karlova v Praze, Praha, Česká republika Kontakt: Jana Bartáková Ústav biofyziky a informatiky 1.LF UK v Praze Adresa: Salmovská 478/1, , Praha 2 E mail: bartakovaj@gmail.com Cíle výzkumu Naším hlavním cílem je zjistit, zda kontrolní vyšetření štítné žlázy u těhotných žen léčených levothyroxinem (LT4) jsou v České republice v souladu s doporučením v současnosti platné směrnice Americké Tyreologické Asociace (ATA) 2011 nebo Endokrinní Společnosti (ES) Naším druhotný cílem je vyhodnocení možnosti snížit náklady modifikací používaných laboratorních testů štítné žlázy v klinické praxi. Současný stav poznání Okolo % těhotných žen má pozitivní protilátky proti tyreoidální peroxidáze (TPOAb) [1, 2, 3] a až 5 % má zvýšený tyreoidální stimulační hormon (TSH) [4, 5]. Negativní dopad neléčeného onemocnění štítné žlázy na plodnost, průběh těhotenství, poporodní období a vývoj plodu byl již dobře popsán [5, 6, 7, 8, 9]. Dosud však nebyla publikována žádná studie zaměřující se na management následných vyšetření při onemocnění štítné žlázy v těhotenství v současné klinické praxi. V letech 2011 a 2012 byly publikovány směrnice managementu onemocnění štítné žlázy v těhotenství dvou společností ATA a ES [10, 11]. Obě směrnice obsahují doporučení týkající se zahájení léčby LT4 a četnost následných kontrol štítné žlázy v případě, je-li léčba započata. Mezi směrnicemi existuje vysoký stupeň shody: štítná žláza by měla být testována pomocí TSH každý týden v průběhu prvního trimestru těhotenství. V druhém a třetím trimestru směrnice od ES doporučuje pokračovat v testování každý týden, zatímco ATA doporučuje provést kontrolu TSH během tohoto období pouze dvakrát (jedenkrát ve druhém trimestru a jedenkrát ve třetím trimestru). Kromě mírně odlišného doporučení směrnic se však může lišit i samotná endokrinologická praxe. V roce 2013 byli požádáni kliničtí členové ES, ATA a AACE (Americká Asociace Klinických Endokrinologů), aby vyplnili webový dotazník obsahující 30 otázek zabývajících se testováním, léčbou a modifikovatelnými faktory v managementu hypotyreózy. Z 821 respondentů by 67,7% kontrolovalo laboratorní tyreoidální testy v průběhu těhotenství každé čtyři týdny, 21,4% každých osm týdnů, 7,9% každých 12 týdnů a 2,9% každé dva týdny (12). V naší studii z let bylo vyšetřeno 188 těhotných žen léčených LT4, které byly následně sledovány a vyšetřovány v souladu s doporučením směrnice ATA Vyšetření štítné žlázy ve třetím trimestru ( gestační týden) bylo vyhodnoceno v případě nekomplikované hypotyreózy a/nebo pozitivních TPOAb jako nadbytečné a produkující neadekvátně vysoké náklady oproti nízké pravděpodobnosti přínosů. Přestože se management onemocnění štítné žlázy v těhotenství nejeví v principu komplikovaně, v klinické praxi tomu může být jinak. Bylo by proto vhodné, aby využívání laboratorních tyreoidálních testů v průběhu těhotenství byla věnována větší pozornost. Uplatnění v biomedicíně a zdravotnictví Nevhodné využívání laboratorních testů je v systému zdravotnictví široce rozšířenou a nákladnou záležitostí [13, 14, 15, 16]. Management onemocnění štítné žlázy u těhotných žen lze snadno modifikovat efektivnějším využíváním tyreoidálních testů, a to například na základě studie doporučované četnosti kontrolních vyšetření štítné žlázy, studie skutečné klinické praxe opakovaného testování, případně studie skutečně vyšetřovaných hormonů v endokrinologické praxi. Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Sémantická interoperabilita v biomedicíně a zdravotnictví
10 4 Bartáková J., Jiskra J. Management následných vyšetření štítné žázy v těhotenství Kĺıčová slova Onemocnění štítné žlázy Definition: Benigní nebo maligní stav ovlivňující strukturu či funkci štítné žlázy. Synonyma: Porucha štítné žlázy Zdroj: The Free Dictionary [online] [cit ]. Dostupné z: thefreedictionary.com/ SNOMED CT: MeSH: C ICD10: E00-E07 Zdroj: Clinique health [online] [cit ]. Dostupné z: index.php?option=com_zoo&task=item&item_ id=1505&itemid=4 SNOMED CT: MeSH: nenalezeno ICD10: Y42.8 Levothyroxin Definice: Hormon štítné žlázy používaný v podobě sodné soli k léčbě hypotyreózy, léčbě a prevenci strumy a karcinomu štítné žlázy. Synonyma: L-Thyroxin Těhotenství Definice: Období od početí do porodu. Synonyma: Gravidita Zdroj: The Free Dictionary [online] [cit ]. Available from: thefreedictionary.com/ SNOMED CT: MeSH: G ICD10: Z33 Tyreoidální stimulační hormon Definice: Hormon vylučovaný z předního laloku hypofýzy a stimulující štítnou žlázu. Synonyma: Tyreotropin, Tyreotropní hormon, hormon stimulující štítnou žlázu, TSH Zdroj: Merriam Webster: An Encyclopedia Britannica Company [online] [cit ]. Available from: SNOMED CT: MeSH: D ; D ICD10: Y42.8 Protilátky proti tyreoidální peroxidáze Definice: Protilátky namířené proti tyreoidální peroxidáze jsou enzym, normálně přítomný ve štítné žláze a hrající důležitou roli v produkci hormonů štítné žlázy. Synonyma: anti-tpo, protilátky TPO, tyreoperoxidázové protilátky, protilátky proti peroxidáze štítné žlázy Zdroj: The Free Dictionary [online] [cit ]. Available from: thefreedictionary.com/ SNOMED CT: MeSH: D ; D ICD10: Y42.1 Reference [1] Springer D, Zima T, Limanova Z. Reference intervals in evaluation of maternal thyroid function during the first trimester of pregnancy. European journal of endocrinology / European Federation of Endocrine Societies. 2009;160(5): [2] Lazarus JH, Kokandi A. Thyroid disease in relation to pregnancy: a decade of change. Clinical endocrinology. 2000;53(3): [3] Glinoer D. The regulation of thyroid function in pregnancy: pathways of endocrine adaptation from physiology to pathology. Endocrine reviews. 1997;18(3): [4] Potlukova E, Potluka O, Jiskra J, Limanova Z, Telicka Z, Bartakova J, et al. Is age a risk factor for hypothyroidism in pregnancy? An analysis of 5223 pregnant women. The Journal of clinical endocrinology and metabolism. 2012;97(6): [5] Allan WC, Haddow JE, Palomaki GE, Williams JR, Mitchell ML, Hermos RJ, et al. Maternal thyroid deficiency and pregnancy complications: implications for population screening. Journal of medical screening. 2000;7(3): [6] Lazarus JH. Thyroid function in pregnancy. British medical bulletin. 2011;97: [7] Krassas GE, Poppe K, Glinoer D. Thyroid function and human reproductive health. Endocrine reviews. 2010;31(5): [8] Casey BM, Dashe JS, Wells CE, McIntire DD, Leveno KJ, Cunningham FG. Subclinical hyperthyroidism and pregnancy outcomes. Obstetrics and gynecology. 2006;107(2 Pt 1): [9] Benhadi N, Wiersinga WM, Reitsma JB, Vrijkotte TG, Bonsel GJ. Higher maternal TSH levels in pregnancy are associated with increased risk for miscarriage, fetal or neonatal death. European journal of endocrinology / European Federation of Endocrine Societies. 2009;160(6): [10] Stagnaro-Green A, Abalovich M, Alexander E, Azizi F, Mestman J, Negro R, et al. Guidelines of the American Thyroid Association for the diagnosis and management of thyroid disease during pregnancy and postpartum. Thyroid : official journal of the American Thyroid Association. 2011;21(10): Sémantická interoperabilita v biomedicíně a zdravotnictví
11 Bartáková J., Jiskra J. Management následných vyšetření štítné žázy v těhotenství 5 [11] Lazarus J, Brown RS, Daumerie C, Hubalewska-Dydejczyk A, Negro R, Vaidya B European thyroid association guidelines for the management of subclinical hypothyroidism in pregnancy and in children. European thyroid journal. 2014;3(2): [12] Burch HB, Burman KD, Cooper DS, Hennessey JV. A 2013 survey of clinical practice patterns in the management of primary hypothyroidism. The Journal of clinical endocrinology and metabolism. 2014;99(6): [13] Leese B. Is there too much laboratory testing? Reprt 79. York, Great Britain: University of York. 1991:29pp. [14] Beck JR. Does feedback reduce inappropriate test ordering? Archives of pathology & laboratory medicine. 1993;117(1):33-4. [15] Bareford D, Hayling A. Inappropriate use of laboratory services: long term combined approach to modify request patterns. BMJ (Clinical research ed). 1990;301(6764): [16] van Walraven C, Raymond M. Population-based study of repeat laboratory testing. Clinical chemistry. 2003;49(12): Sémantická interoperabilita v biomedicíně a zdravotnictví
12 6 Berger J., Beyr K. Bezpečnost osobních dat a Big Data v biomedicíně Bezpečnost osobních dat a Big Data v biomedicíně Jiří Berger 1, Karel Beyr 1 Ústav patologické fyziologie, Praha, Česká republika Kontakt: Jiří Berger Ústav patologické fyziologie Adresa: U Nemocnice 5, Praha 2 E mail: jiri.berger@e-fractal.cz Cíle výzkumu Big Data skrývají obrovský potenciál pro výzkum v oblasti biomedicíny v mnoha oblastech: analýza segmentace pacientů, ceny a výsledku léčby umožní zjistit zdravotně a cenově nejefektivnější postup léčení pro konkrétního pacienta; proaktivní identifikace pacientů, u nichž by se vyplatila zdravotnická prevence; z analýzy výskytu chorob lze dělat epidemiologické závěry a navrhovat preventivní opatření; pomoc při detekci a minimalizaci pokusů o podvod ve zdravotnictví; možnost spolupráce s farmaceutickými společnostmi tak, že pro ně bude možno snadněji identifikovat skupinu relevantních pacientů pro klinické testy (za předpokladu předchozího souhlasu pacientů). V dnešní době je patrný trend digitalizace zdravotnických archivů a související dokumentace, nastává tedy čas na zapojení technologií označovaných jako Big Data v oblasti biomedicínské informatiky. Tyto technologie nabízejí rychlejší a efektivnější zpracování a sdílení obrovského množství dat. Vzhledem k tomu, že zdravotní péče pracuje s velmi citlivými daty, je hlavním zájmem ochrana dat pacientů. V mnoha zemích probíhá programové zavádění elektronizace zdravotní péče. Například v USA probíhá Health Information Technology for Economic and Clinical Health Act, (HI- TECH). Cílem výzkumu je návrh a definice pravidel, která zamezí zneužití a únikům citlivých biomedicínských dat. Současně však v minimální míře omezí efektivitu jejich zpracování a kvalitu výstupních dat. Současný stav poznání Čím větší množství heterogenních biomedicínských informací se podaří sdružit pod technologie Big Data tak, aby obsahovaly co nejkompletnější záznamy, tím vyšší hodnotu mohou mít pro budoucí zpracování různých druhů analýz na základě zdravotní dokumentace celé populace a souvisejících biomedicínských informací. Jakmile dojde k nastavení takového projektu, ač autoři tohoto článku připouští, že větší než technický to bude organizačně etický problém, bude nejefektivnějším způsobem práce s takovým množstvím dat zpřístupnění anonymizovaných informací odborné veřejnosti jako zdroj výzkumu. V zahraničí je obvyklé, že pokud je projekt zcela nebo i jen částečně financován a podporován z veřejných zdrojů, bývají nastaveny podmínky tak, aby byly informace dostupné k nekomerčním aktivitám s minimálními omezeními. I přesto, že biomedicínské informace, obzvláště s ohledem na citlivost uchovávaných dat, nebude nikdy možné poskytovat zcela bez omezení, stále existuje široká škála použití, implementací a aplikací, pro které by byl takový přístup výhodný. To však, obzvláště díky použití populačních dat, s sebou přináší rizika možnosti nepřímé identifikace konkrétních informací o pacientech. Sebemenší náznak zneužití přináší etické problémy, a může tak zastavit veškerý výzkum. Aby se předešlo možnému zneužití, je nutné nastavit velmi přísná a efektivní pravidla, umožňující maximální výtěžnost dat při současném striktním zachování anonymity a ochrany osobních údajů. Současně je nutné regulovat způsoby vytěžování dat tak, aby nemohlo dojít ke zneužití nebo úniku citlivých informací jakýmkoliv, i jen teoreticky proveditelným, způsobem. V zahraničí již existuje odpovídající legislativa, např. aktuální verze Health Insurance Portability and Accountability Act (HIPAA) v USA, která specifikuje standardy transakcí se zdravotními záznamy, obdobně směrnice EU Data Protection Directive 95/46/EC, která definuje požadavek souhlasu pacienta se zpracováním jeho údajů a přenositelnost dat. EU však stále nemá jednotný přístup k ochraně citlivých údajů [1]. Sémantická interoperabilita v biomedicíně a zdravotnictví
13 Berger J., Beyr K. Bezpečnost osobních dat a Big Data v biomedicíně 7 Uplatnění v biomedicíně a zdravotnictví Využívání Big Data v biomedicíně a zdravotnictví bude mít vždy svá specifika. Míra anonymizace použitých dat bude nepřímo úměrná kvalitě výstupů [2]. Znamená to, že jedním z klíčových prvků úspěšného využití Big Data v biomedicíně a zdravotnictví bude nastavení hranice mezi anonymizací a potenciálem vytěžených dat. Pro efektivní využití by bylo potřebné provést zcela základní anonymizaci, která z dat odstraní (nebo zaručeným způsobem znepřístupní) jen základní osobní informace, jako je jméno, příjmení a rodné číslo, a nahradí je anonymním údajem, který však přesto zajistí identifikaci subjektu napříč daty. Takto upravená data však budou stále zranitelná, a proto je nutné jednotlivým způsobům potenciálních útoků efektivně předcházet. Například dotaz, který vrací předepsaná léčiva a jejich dávkování konkrétnímu pacientovi, obsahuje citlivá data. Ze znalosti druhu léčiv lze usuzovat na diagnózu pacienta. Pokud budou osobní údaje anonymizované, lze usoudit, že poskytnutá data nebudou citlivá. Oproti tomu typickými dotazy, které poskytují data, jenž nejsou citlivá, jsou například: Dotaz, který získá počet pacientů daného lékaře, nemusí nutně obsahovat citlivá data. Stejně tak dotaz na seznam předepsaných léčiv v daném regionu nevrací citlivé výsledky. Podobně výskyt specifické diagnózy napříč populací neposkytuje citlivé údaje. Bezpečnost databázových dat jako celku Jednou z metod zvýšení bezpečnosti dat v biomedicíně a lékařství je šifrování podkladových dat, které přidává další bezpečnostní vrstvu navíc, a právě návrh této architektury umožňuje významně snížit možnosti zneužití dat [3]. Existují specializované pokročilé algoritmy[4] umožňující šifrování medicínských záznamů tak, že umožní jejich rozšifrování pouze osobám s relevantním oprávněním. Algoritmy mají několik výhod oproti klasickým šifrovacím způsobům (symetrické i asymetrické šifry) oproti RSA konceptu jsou rychlejší, levnější a flexibilnější, oproti symetrickým šifrám poskytují bezpečnost v případě vyzrazení sdíleného hesla. V [5] popisují autoři možnosti vyhledávání nad takto šifrovanými medicínskými daty. Tento algoritmus je ideální pro koncept Big Data. Šifrování přinese zpomalení vyhledávání, proto jej nelze doporučit pro použití pro celé úložiště, nýbrž pouze pro základní data pacientů, u kterých je jasně daná struktura. Nepřímé získání konkrétních dat z částečně anonymizovaného souboru dat V případě, že se v databázi nacházejí kompletní neanonymizovaná data nebo častěji data, která prošla pouze základní anonymizací, v rámci níž byla nahrazena základní data pacientů (jméno, příjmení, rodné číslo), ale zbytek datového souboru je kompletní, je nutné detailně řešit principy omezení přístupu. V takovém případě lze při cíleném útoku kombinací dotazů získat velmi konkrétní data, nebo přinejmenším data která lze s vysokou pravděpodobností interpretovat zcela konkrétně. Z výše uvedených důvodů je nutné zavést takové koncepční řešení, jež spočívá v omezení dotazů, jejichž kombinace může odhalit citlivé údaje, případně takové kombinace umožnit jen osobám s vyšším oprávněním a současně zajistit zpětnou kontrolu a analýzu rizikovosti používaných dotazů a jejich výsledků. Dalším rizikovým dotazem je takový, který ve svém výsledku předá významně malý počet výstupních entit. Dotazy mohou obsahovat kombinaci několika faktorů. Pokud je ale daný dotaz překombinován, může dojít v extrémním případě k situaci, že jeho výsledkem bude pouze jeden pacient, u kterého i bez znalosti jména můžeme odvodit, o koho se jedná. Například pokud známe i pouhou část chorobopisu daného člověka, lze pomocí souvisejících informací (věk, pohlaví, bydliště) nepřímo získat jeho citlivé informace. Takové riziko se dá do určité míry eliminovat nasazením heuristických pravidel a jejich postupným zpřesňováním, a tím zablokovat odpovědi, které by mohly obsahovat rizikovou množinu informací. Nepřímé získání konkrétních dat z plně anonymizovaného souboru dat V případě volby varianty anonymizace datového souboru lze za stanovených podmínek umožnit plný přístup do databáze. Před uložením dat do databáze je možno (případně nutno, podle dané legislativy) data anonymizovat (odstranit jméno, rodné číslo) a zároveň generalizovat. Tomuto způsobu říkáme plná anonymizace. Generalizace spočívá ve znesnadnění identifikace osoby pomocí tzv. kvaziidentifikátorů to jsou například datum narození, adresa a pohlaví. Pomocí kvazi-identifikátorů unikl na veřejnost např. zdravotní stav guvernéra státu Massachusetts poté, co byly zveřejněny jeho kvazi-identifikátory z volebního záznamu, které odpovídaly jeho anonymizovanému zdravotnímu záznamu. V [6] popisují autoři generalizaci dat založenou na tom principu, že nesmí existovat množiny pacientů majících stejné kvazi-identifikátory obsahující méně než K prvků. Tento přístup znesnadňuje identifikaci osob, ale byly zjištěny případy, kdy i přes K-anonymizaci bylo možná identifikace. V [7] autoři vychází z K-anonymizace a navrhují zlepšení, L-anonymizaci. Ta spočívá v tom, že Sémantická interoperabilita v biomedicíně a zdravotnictví
14 8 Berger J., Beyr K. Bezpečnost osobních dat a Big Data v biomedicíně vyžaduje různorodost citlivých údajů v množině osob se stejnými kvazi-identifikátory. Další možností generalizace je znepřesnění kvaziidentifikátorů. Stejná data mohou být v databázi uložena několikrát, pokaždé s různým stupněm přesnosti, s tím, že čím větší má čtenář oprávnění, tím k přesnějším datům se může dostat. Např. místo data narození se uchovává pouze rok nebo dokonce jen dekáda, místo adresy pouze název obce či kraje. Jiná možnost generalizace spočívá v tom, že některé kvazi-identifikátory nebudou v databázi vůbec dostupné. V zahraničí se pro popis chorob a symptomů používají ICD kódy (International Statistical Classification of Diseases and Related Health Problems) spadající pod správu WHO. Tyto kódy mají hierarchickou strukturu, a tudíž se přímo nabízejí ke generalizaci. Autoři [8] uvádí pravděpodobnost identifikace pacienta podle četnosti raritních ICD kódů. Doporučují odstranit 5% až 25% raritních kódů (symptomů) a nahradit je jejich generalizací. Tím se významně sníží pravděpodobnost identifikace pacienta, za relativně nízkou cenu ztráty přesnosti dat. Netriviálnost dotazování Velký problém týkající se výzkumu nad Big Data v biomedicínské informatice spočívá ve vlastní tvorbě dotazů. Nelze předpokládat, že by významná většina vědeckých pracovníků zabývající se biomedicínským oborem byla schopna a ochotna programovat vlastní Map/Reduce paralelní programy pro řešení dotazů nad Big Data medicínskou databází. Spíše bude pravděpodobným scénářem nastavení takové spolupráce, kdy informatici, analytici nebo programátoři vytvoří nástroje, které bude možné parametrizovat, spouštět apod. Obě výše popsané oblasti (bezpečnost a netrivialita dotazování) je možné vyřešit pomocí dotazovacího nástroje. Nástroj by obsahoval dotazů, programů šablony nebo algoritmů, které by se daly při použití uživatelského rozhraní parametrizovat a takto použít k prohledávání databáze odbornou veřejností, aniž by musela procházet náročným procesem školení a výuky používání Big Data. Použití šablon by jako primární cíl mělo výrazně usnadnit používání širší vědecké komunitě a zvýšit dostupnost takto zaměřeného výzkumu a jeho výstupů pro široké spektrum aplikací. Zároveň by se tímto způsobem elegantně vyřešila otázka bezpečnosti. Příklad šablon: Preskripce konkrétní účinné látky dle lékařské specializace; Analýza četnosti podle místa trvalého pobytu pacienta; Demografická skladba pacientů; Sezónní objemy výkonů medicínských zařízení; Závislost výskytu chorob na druhu zaměstnání pacienta. Pro tuto potřebu lze vybudovat několikavrstvou architekturu, která bude nadstavbou základních Big Data technologií v konkrétní biomedicínské implementaci a bude rozdělena nejméně do těchto vrstev: 1. Odborná veřejnost bude moci používat pouze předpřipravené šablony, do kterých bude možné vkládat vlastní parametry, ale nebude možné měnit podstatu dotazů. Dotaz půjde pokládat pouze jednou šablonou, šablony nelze kombinovat. Takto bude zaručeno, že nedojde k úniku citlivých údajů. Tento přístup bude sloužit např. postgraduálním studentům pro jejich základní výzkum. 2. Specializovaná pracoviště budou schopna kombinovat šablony a více parametrizovat jednotlivé dotazy. Současně však bude nad jejich činností bdít sada heuristických pravidel, jež bude reportovat nebo ve vybraných případech i blokovat použití kombinace dotazů, které mohou přinášet riziko úniku konkretizovatelných dat. 3. Analytický tým bude připravovat šablony včetně heuristických pravidel, která budou používání takových šablon hlídat. Současně bude pod standardními bezpečnostními kontrolami (auditní log, analýza četnosti výsledků apod.) schopen Big Data sám využívat v případě, že bude existovat vysoké riziko práce s citlivými daty. V takovém týmu budou lidé s odpovídajícím prověřením, na které budou aplikované i procesní postupy zajišt ující bezpečnost využívání dat. Tento tým pak může jako součást své náplně práce zpracovávat komplexní úlohy a dotazy dle požadavků jednotlivých pracovišt v případech, kdy nebude efektivní použít schematické šablony a současně bude existovat riziko úniku citlivých dat. Získaná data budou před předáním žádajícímu pracovišti zkontrolována a v případě potřeby bude soubor výsledků dodatečně anonymizován. 4. Úzký specializovaný auditní tým bude nastavovat pokročilá heuristická pravidla nad celým systémem, schvalovat šablony před zveřejněním a definovat bezpečnostní pravidla. 5. Posledním prvkem může v budoucnosti být systém pracující s prvky umělé inteligence, který bude na základě souboru informací s využitím pokročilých algoritmů rozpoznávání vzorců, neuronových sítí a učícího se procesu automatizovaně vyhledávat a vyhodnocovat nepodchycené principy a možnosti zneužití dat v reálném čase. Diskuze Pokračování výzkumu bude zaměřeno na několik klíčových oblastí. Sémantická interoperabilita v biomedicíně a zdravotnictví
15 Berger J., Beyr K. Bezpečnost osobních dat a Big Data v biomedicíně 9 První z nich je zaměření na obvyklá bezpečnostní pravidla a související technologie zabezpečení dat, jejich využití v rámci biomedicínských dat a definice specifik a odchylek přístupu k biomedicínským datům a zdravotním záznamům oproti standardně využívaným metodám ochrany dat. Do této oblasti patří hlavně analýza principů šifrovacích algoritmů dle udělených oprávnění, jejich přínosy a nevýhody a v neposlední řadě i vztah různých principů šifrování k možnostem a efektivitě analýzy dat. Další oblastí bude výzkum míry anonymizace s ohledem na výtěžnost a efektivitu jejich zpracování a definice principů a vlivu anonymizace na biomedicínská data s ohledem na teoretické možnosti nepřímého získání konkrétních dat za pomocí kombinace pokládaných dotazů. Tato široká problematika bude rozpracována jak v teoretické rovině, tak dojde ke zobecnění konkrétních případů získaných kombinatorickými metodami z reprezentativního vzorku anonymizovaných dat při jejich porovnání se skutečnými daty a s vyhodnocením míry shody. Nejrozsáhlejší oblastí výzkumu je definice rozhraní mezi programátorskými metodami a možnosti využití šablon dotazů, kde hlavním cílem bude nalezení hranice, která zajistí vysokou míru kontroly při současném zpřístupnění dotazovacích metod široké odborné veřejnosti v takové podobě, kdy jednotliví koncoví uživatelé budou schopni bez programování a významnější míry zaškolení provádět vlastní výzkum nad daty. Cílovým stavem je nalezení rozhraní, které pro odbornou veřejnost bude svou použitelností přirovnatelné k pokročilejšímu používání kancelářských softwarových balíků, jakými jsou např. MS Excel nebo MS Access, případně jejich alternativy. V rámci této oblasti bude analyzováno a upřesněno rozdělení práv a zodpovědností do navržených čtyř rolí, jejich podrobný popis a procesní zmapování vztahů těchto rolí k zajištění bezpečnosti dat. V rámci jednotlivých rolí budou analyzována potenciální rizika a hrozby včetně principů, jak jim předcházet. V základní podobě bude rozpracován i princip využití heuristických analýz a prvků umělé inteligence jako nástroje pro zvýšení ochrany biomedicínských dat a zdravotnických záznamů. Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Osobní údaje Definice: Veškeré informace o identifikované nebo identifikovatelné osobě. Synonyma: Data identifikující osobu Zdroj: čl. 2 písm. a) směrnice č. 95/46/ES o ochraně fyzických osob v souvislosti se zpracováním osobních údajů a o volném pohybu těchto údajů SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Big Data Definice: Big Data je sada prostředků a technologií, které vyžadují nové formy integrace k odkrytí skrytých vazeb z databází, které jsou rozmanité, komplexní a rozsáhlé. Synonyma: Cloudové úložiště, několikaserverová databáze Zdroj: [6] SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Anonymizace Definice: Proces, kterým se zašifrují nebo odstraní osobní údaje z množiny dat tak, že lidé, které daná data popisují, zůstanou anonymní. Synonyma: Očištění dat od osobních údajů Zdroj: [6] SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Reference [1] Boussi Rahmouni H, Solomonides T, Casassa Mont M, Shiu S. Modelling and Enforcing Privacy for Medical Data Disclosure across Europe. In Adlassnig KP, editor. Medical Informatics in a United and Healthy Europe Proceedings of. Sarajevo: IOS Press ; p [2] Duncan et al. Disclosure Risk vs. Data Utility: The R-U Confidentiality map: Los Alamos National Library; [3] Amazon Web Services. Creating Healthcare Data Applications to Promote HIPAA and HITECH Compliance [4] Alshehri, Radziszowski, Raj K. Designing a Secure Cloud- Based EHR System using Ciphertext-Policy Attribute-Based Encryption. [5] Narayan S, Gagné M, Reihaneh SN. Privacy preserving EHR system using attribute-based infrastructure. [6] Sweeney L. k-anonymity: a model for protecting privacy. International Journal on Uncertainty. 2002; 10(5): p [7] Machanavajjhala A, Kifer D, Gehrke J, Venkitasubramaniam M. L-diversity: Privacy beyond k-anonymity. ACM Transactions on Knowledge Discovery from Data March; 1(1). [8] Vinterbo S, L OM, S D. Hiding information by cell suppression. In Proc AMIA Symp; p Sémantická interoperabilita v biomedicíně a zdravotnictví
16 10 Bielniková H. a kol. Role jednonukleotidových polymorfismů v patogenezi vysokostupňových gliomů Role jednonukleotidových polymorfismů v patogenezi vysokostupňových gliomů Hana Bielniková 1,2, Petr Buzrla 1, Ondřej Bielnik 3, Radoslava Tomanová 1, Irena Urbanovská 4, Lucie Hrušková 2, Jana Dvořáčková 1, Ivan Mazura 2 1 Ústav patologie, Fakultní nemocnice Ostrava, Ostrava, Česká republika 2 1. lékařská fakulta, Karlova univerzita v Praze, Praha, Česká republika 3 Neurochirurgická klinika, Fakultní nemocnice Ostrava, Ostrava, Česká republika 4 CGB laboratoř Ostrava a.s., Ostrava, Česká republika Kontakt: Hana Bielniková Ústav patologie, Fakultní nemocnice Ostrava Adresa: 17. listopadu 1790, 70852, Ostrava-Poruba E mail: hana.bielnikova@ .cz Cíle výzkumu Jednonukleotidové polymorfismy (SNP) jsou odchylky jednotlivých nukleotidů v sekvenci deoxyribonukleové kyseliny (DNA) mezi dvěma jedinci. Jde o jedny z nejčastěji se vyskytujících genetických změn v kódujících i nekódujících oblastech lidského genomu [1]. Účinky těchto změn se projevují v závislosti na lokalizaci polymorfismů v DNA. Pokud se SNP nachází v nekódujících oblastech, jejich vliv na organismus je obvykle zanedbatelný a většinou nevede k fenotypovým projevům. Při výskytu polymorfismů v kódujících oblastech je jejich případný dopad na fenotyp dán řadou podmínek. Cílem mé práce je izolace DNA z nádorové tkáně pacientů s diagnózou astrocytomu nebo glioblastomu a následná analýza vybraných genů pomocí molekulárněgenetických metod. Získaná fenotypová, klinická a genetická data budou posuzována z hlediska jejich možné korelace. Současný stav poznání Gliomy mozku jsou jedny z nejčastějších primárních nádorů mozkové tkáně dospělých. Prognóza těchto tumorů, v závislosti na jejich stupni, je velmi špatná. U maligních typů jako jsou anaplastický astrocytom (AA, stupeň III.) a glioblastom (GBM, stupeň IV.) se doba přežívání pohybuje v rozmezí 3 až 5 let u AA a 15 až 16 měsíců u GBM [2]. Nebezpečím těchto tumorů je jejich infiltrativní růst do mozkové tkáně znesnadňující jejich chirurgické odstranění, vysoká proliferační aktivita, atypie jader, hojná angiogeneze a přítomnost nekróz [3]. Zlatým standardem pro diagnostiku gliomů je histologické vyšetření, které je však komplikováno značnou heterogenitou tumorů a překrývajícími se morfologickými znaky, zvláště u vyšších stupňů. Z tohoto důvodu jsou v posledních letech stále více v diagnostice a léčbě gliomů využívány poznatky z oblasti genetiky. Pomocí cytogenetických a molekulárně-genetických metod byla objevena řada alterací chromozomů a genů, které mají významnou roli v upřesnění typizace tumorů nebo jsou důležitými prediktivními a prognostickými faktory [4]. Množství genetických změn, které se u gliomů vyskytují, je značně široké. Jedná se o změny jak na úrovni celých chromozomů a jejich částí (aneuploidie, delece, duplikace, translokace aj.), tak na úrovni vlákna DNA (bodové mutace, delece, inzerce, amplifikace, substituce, epigenetické změny metylace, acetylace aj.). Většina těchto alterací se týká oblastí, ve kterých se vyskytují důležité tumor-supresorové nebo protoonkogenní geny [5, 6]. V posledních letech se řada výzkumů soustřed uje na hledání souvislostí mezi genetickými polymorfismy a vznikem onkologických onemocnění. Jedním z diskutovaných polymorfismů, také u gliomů, je SNP309 (rs ) v promotorové oblasti genu MDM2. V případě polymorfismu SNP309 dochází k zvýšené schopnosti transkripčního aktivátoru Sp1 navázat se na DNA a tím zvýšit expresi genu MDM2 [7]. Produktem genu MDM2 je protein regulující dráhu p53, jednoho z nejdůležitějších tumor-supresorových faktorů. Protein MDM2 se jako regulátor přímo váže na p53 a negativně ovlivňuje jeho stabilitu a aktivitu. Bylo prokázáno, že i nepatrná změna hladiny MDM2 výrazně ovlivňuje supresorové funkce p53 a u některých typů nádorů je zvýšená exprese tohoto genu spojována s rychlejší progresí onemocnění a slabší odezvou na léčbu [8]. Negativně mohou působit také SNP v kódujících oblastech DNA, kdy v některých situacích záměnou báze Sémantická interoperabilita v biomedicíně a zdravotnictví
17 Bielniková H. a kol. Role jednonukleotidových polymorfismů v patogenezi vysokostupňových gliomů 11 v kodonu dochází k výměně jedné aminokyseliny za jinou. Negativním důsledkem těchto záměn může být vznik defektního nebo nefunkčního proteinu, případně vznik stop kodonu, jehož následkem je vytvoření zkráceného proteinového produktu, často nefunkčního. Uplatnění v biomedicíně a zdravotnictví Většina polymorfismů pravděpodobně přímý vliv na zdraví člověka nemá. Podstatná je lokalizace těchto změn v rámci sekvence nukleové kyseliny. V některých případech jejich přítomnost může pozměnit účinnost léků, ovlivnit reakci organismu na vystavení škodlivinám nebo být asociována se vznikem a rozvojem některých onemocnění. Sledování souvislostí mezi polymorfismy a gliomy nám může přinést nové poznatky o vzniku a rozvoji těchto nádorů, kdy některé z vyšetřovaných SNP by mohly sloužit jako potencionální prognostické a diagnostické ukazatele. Poděkování Studie byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Deoxyribonukleová kyselina Definice: Dvouvláknový polynukleotid tvořený dvěma samostatnými řetězci deoxyribonukleotidových jednotek. Slouží jako nosič genetické informace. Synonyma: DNA, DNK Zdroj: Alberts B, et al. Základy buněčné biologie: Úvod do molekulární biologie buňky. Espero Publishing SNOMED CT: MeSH: D ICD10: nenalezeno Gliom Definice: Nádor CNS vycházející z podpůrné nervové tkáně neuroglie, glie. Patří sem astrocytom, zhoubný glioblastom aj. Gliomy rostou v různých částech mozku. Způsobují epilepsii, psychické změny, růst nitrolebního tlaku s bolestí hlavy a poruchou vidění, ložiskové příznaky atd. Existují ve zhoubné i nezhoubné variantě. Synonyma: Nádor gliálních buněk Zdroj: SNOMED CT: MeSH: D ICD10: nenalezeno Jednonukleotidový polymorfismus Definice: Polymorfismus sekvence DNA daný variabilitou pouze v jedné bázi záměna v jednom nukleotidu DNA, tato záměna musí být v populaci rozšířena. Synonyma: Polymorfismus, SNP Zdroj: SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Genetická mutace Definice: Změna genetické dědičné informace na úrovni DNA týkající se bud genů, nebo celých chromozomů. Podle místa, které je zasaženo, může či nemusí ovlivňovat funkci buňky a organismu. Vzniká samovolně, nebo je způsobena zevními faktory mutageny chemické, fyzikální nebo biologické vlivy. Synonyma: Mutace Zdroj: SNOMED CT: MeSH: D ICD10: nenalezeno Fenotyp Definice: Pozorovatelný vzhled či vlastnost jedince, který je výsledkem jeho dědičných vloh genotypu a působení prostředí. Synonyma: Zdroj: SNOMED CT: MeSH: D ICD10: nenalezeno Sémantická interoperabilita v biomedicíně a zdravotnictví
18 12 Bielniková H. a kol. Role jednonukleotidových polymorfismů v patogenezi vysokostupňových gliomů Reference [1] Clark DP., Molecular biology: Understanding the Genetic Revolution. Elsevier Academic Press, [2] Karajannis MA, Zagzag D., editors. Molecular pathology of nervous system tumors. New York, Springer, [3] Iacob G, Dinca EB. Current data and strategy in glioblastoma multiforme. J Med Lif Agu;2(4): [4] Nikiforova MN, Hamilton RL. Molecular diagnostics of gliomas. Arch Pathol Lab Med May;135: [5] Hersh DS, Mehta RI, et al.the Molecular Pathology of Primary Brain Tumors. Path C Rev Sept;18(5): [6] Duncan ChG, Yan H. Genomic alterations and the pathogenesis of glioblastoma. Cell Cycle Apr;10(8): [7] Wan Y, Wu W, Yin Z, Guan P, Zhou B. MDM2 SNP309, genegene interaction, and tumor susceptibility: an updated metaanalysis. BMC Can.2011;11(208):1-9. [8] Bond GL, Levine AJ. A single nucleotide polymorphism in the p53 pathway interacts with gender, environmental stresses and tumor genetics to influence cancer in humans. Onc 2007;26: Sémantická interoperabilita v biomedicíně a zdravotnictví
19 Gergelits V. O vlastnostech genové konverze 13 O vlastnostech genové konverze Václav Gergelits 1,2 1 Ústav molekulární genetiky AV ČR, Praha, Česká republika 2 1. lékařská fakulta, Univerzita Karlova v Praze, Praha, Česká republika Kontakt: Václav Gergelits Ústav molekulární genetiky AV ČR, v.v.i. Adresa: Vídeňská 1083, Praha 4 E mail: vaclav.gergelits@img.cas.cz Cíle výzkumu Meiotická rekombinace homologních chromozomů je zásadní pro zvyšování vnitrodruhové a mezidruhové genetické diverzity a správnou segregaci chromozomů do gamet. Proces meiotické rekombinace začíná v první meiotické profázi, kdy enzym SPO11 vytváří na všech čtyřech chromatidách dvouřetězcové zlomy (double-strand break, DSB). Vznik DSB je na jedné straně nezbytný pro vývin genetické diverzity, na druhé straně je ale pro přežití buňky nutné všechny DSB opravit. Proces opravy konkrétního DSB začíná uvolněním jednoho vlákna DNA, které si hledá dostatečně podobnou sekvenci u chromatidy homologního chromozomu. DSB je možné opravit i pomocí sesterské chromatidy, na autozomech u savců je však tato možnost dosud jen hypotetická. Po úspěšném nalezení homologního úseku dochází k rekombinaci a DSB se opraví. Rekombinace může proběhnout dvěma různými způsoby. Bud se po kontaktu chromatidová raménka vymění crossover (CO), nebo se chromatidová raménka nevymění noncrossover (NCO). Při obou těchto způsobech dochází ke genové konverzi, jednosměrnému přesunu informace z dárcovské chromatidy do druhé, přijímající chromatidy. O procesu NCO je známo méně než o procesu CO. Detekce genové konverze je dobrým způsobem, jak ukázat na místa na genomu, kde proběhla NCO, a lépe tak pochopit mechanismus NCO a genové konverze. Výzkum genové konverze je obecně motivován její rolí v evoluci a dynamice genomu, snahou o popis mechanismu rekombinace a kvůli jejímu vztahu k lidským nemocem [1]. V mém doktorském projektu se zabývám možnostmi detekce elementů genové konverze při NCO za využití myšího modelu. Cílem je detekce a charakterizace elementů genové konverze v celochromozomálním měřítku a následná inference, jakými mechanismy genová konverze a NCO probíhá. Předmětem tohoto článku je pojednání o základních vlastnostech genové konverze a NCO u člověka a savců obecně včetně jejího vztahu k lidským nemocem. Současný stav poznání Je známo, že místa CO se v genomu nevyskytují náhodně, ale shlukují se v místech délky v řádu kilobází, kde je jejich výskyt výrazně pravděpodobnější, v tzv. rekombinačních hotspotech. Rekombinační hotspoty jsou u savců určovány téměř výlučně genem Prdm9. Každá alelická forma genu Prdm9 určuje vazebná místa místa na genomu délky v řádu desítek bází, na kterých se můžou vytvářet DSB. Nově se ukazuje, že v těch samých hotspotech se vyskytují také NCO [2]. Existuje několik studií, které se zabývaly odhadem délky úseků genové konverze u savců založených na různých typech dat. Úseky genové konverze doprovázející NCO jsou typicky kratší než úseky doprovázející CO. Délka genových konverzí při NCO se odhadovala na bp [5]. Dvě současné práce referují o detekci úseků genové konverze při NCO délky 86 ± 49 bp [4] a bp [2]. Úseky genové konverze při CO byly poprvé přímo detekovány tetrádovou analýzou a jejich délka byla určena pro dva různé hotspoty: 626 ± 319 bp a 566 ± 277 bp [4]. Předmětem zájmu je též podíl výskytu událostí NCO a událostí CO. Podle počtu DSB, které se vyskytnou během meiózy, lze usuzovat, že opravy DSB pomocí NCO proběhnou v 90 % případů a pomocí CO v 10 % případů. Četnost výskytu NCO a CO se ale napříč genomem odlišuje. Ve dvou různých hotspotech byly pozorovány poměry NCO:CO 1:1 a 15:1 [4]. Podle kvantitativních vlastností genové konverze lze usuzovat, jakým mechanismem probíhají. Klasický Szostakův model [6] předpokládal, že u savců k opravě DSB dochází v obou procesech CO i NCO mechanismem rozrušení dvojitého Hollydayova spoje (double Hollyday Junction, dhj). Nyní však Francesca Cole a kolektiv ve své práci [4] naznačují, že se jedná o jiný mechanismus, např. Synthesis-dependent strand annealing (SDSA). Události genové konverze spolu s CO přispívají k evoluci genomu. Mechanismem genové konverze se kopíruje úsek DNA délky v řádu desítek až stovek bází z dárcovské chromatidy do přijímající homologní chroma- Sémantická interoperabilita v biomedicíně a zdravotnictví
20 14 Gergelits V. O vlastnostech genové konverze tidy. Dárcovská chromatida zůstává nezměněna, zatímco v přijímající chromatidě je nahrazen původní úsek DNA dárcovským úsekem. Genová konverze se na evoluci genomu podepisuje několika způsoby; uved me tři příklady: 1. Genová konverze způsobuje GC vychýlení častěji totiž dochází k jednostrannému přenosu polymorfismů s bázemi G a C než s bázemi A a T. Uvažuje se, že se toto GC vychýlení kompenzuje náhradou nukleotidu C nukleotidem T, ke které dochází v souvislosti s předchozí metylací cytosinu. 2. Genová konverze velkou měrou zapříčiňuje evoluci centromer, které jinak podstupují výrazně nižší počet CO než okolní oblasti [7]. 3. Genová konverze souvisí s tzv. hotspotovým paradoxem: Jak můžou rekombinační hotspoty, které jsou určovány in-trans genem Prdm9, vůbec existovat? Právě díky tomu, že to jsou rekombinační hotspoty, se na jejich místě často utváří DSB, které jsou opravovány procesem, při kterém dochází ke genové konverzi. Opravou DSB dochází ale k modifikaci vazebného místa, které pak už dále nemůže být vazebným místem. Práce F. Cole a kolegů [4] přinesla částečné vysvětlení tohoto paradoxu. Ukazuje se v ní, že k erozi vazebných míst dochází zhruba jen v 20 % případů genové konverze při NCO. Ve zbytku případů je genovou konverzí změněno pouze okolí vazebného místa. Uplatnění v biomedicíně a zdravotnictví NCO a genová konverze jsou jedním z procesů, ke kterým hojně dochází během meiózy, buněčného dělení, které probíhá u všech pohlavně se rozmnožujících eukaryot. NCO tedy přirozeně souvisí i s patogenezí u člověka. Existuje minimálně 18 lidských nemocí, jejichž vznik souvisí s projevy genové konverze, uved me např.: Kampomelická dysplazie, Hypergonadotrofický hypogonadismus, syndrom Hurler/Scheie [1]. Na základě našich nepublikovaných dat se domníváme, že genová konverze může souviset s mechanismy hybridní sterility. Poděkování Studie byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Genová konverze Definice: Genová konverze je proces, při kterém je jedna sekvence DNA kopírována z jednoho úseku genomu (dárcovského) do druhého (přijímajícího) a jehož výsledkem je substituce, inzerce, nebo delece sekvence DNA u příjemce. Zdroj: [3] SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Homologní rekombinace Definice: Proces, při kterém dochází k výměně dvou úseků DNA mezi dvěma duplexy DNA, které sdílejí vysokou míru podobnosti. Zdroj: [1] SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Dvouřetězcový zlom Definice: Zlomy v protilehlých vláknech DNA, jejichž vzájemná vzdálenost je 10 20bp. Synonyma: DSB Zdroj: [1] SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Reference [1] Chen, J. M., Cooper, D. N., Chuzhanova, N., Férec, C., & Patrinos, G. P. (2007). Gene conversion: mechanisms, evolution and human disease. Nature Reviews Genetics, 8(10), [2] Williams, A. L., Genovese, G., Dyer, T., Altemose, N., Truax, K., Jun, G., & Przeworski, M. (2015). Non-crossover gene conversions show strong GC bias and unexpected clustering in humans. elife, 4, e [3] Assis, R., & Kondrashov, A. S. (2012). A strong deletion bias in nonallelic gene conversion. PLoS Genet, 8(2), e e [4] Cole, F., Baudat, F., Grey, C., Keeney, S., de Massy, B., & Jasin, M. (2014). Mouse tetrad analysis provides insights into recombination mechanisms and hotspot evolutionary dynamics. Nature genetics, 46(10), [5] Jeffreys, A. J., & May, C. A. (2004). Intense and highly localized gene conversion activity in human meiotic crossover hot spots. Nature genetics, 36(2), [6] Szostak, J. W., Orr-Weaver, T. L., Rothstein, R. J., & Stahl, F. W. (1983). The double-strand-break repair model for recombination. Cell, 33(1), [7] Shi, J., Wolf, S. E., Burke, J. M., Presting, G. G., Ross-Ibarra, J., & Dawe, R. K. (2010). Widespread gene conversion in centromere cores. PLoS Biol, 8(3), e Sémantická interoperabilita v biomedicíně a zdravotnictví
21 Hrušková L. Detekce mutací v genech kolagenu typ I 15 Detekce mutací v genech kolagenu typ I Lucie Hrušková 1 1 Klinika dětského a dorostového lékařství, 1. lékařská fakulta, Karlova univerzita v Praze, Česká republika Kontakt: Lucie Hrušková 1. lékařská fakulta, Karlova univerzita v Praze Adresa: Kateřinská 32, Praha 2 E mail: black.luca@seznam.cz Cíle výzkumu Kolagen typ I je hlavním strukturálním proteinem pojivové tkáně, zejména kostí a kůže. Jedná se o heterotrimer skládající se ze dvou alpha1 (I) řetězců a jednoho alpha2 (I) řetězce, které jsou kódovány geny COL1A1 a COL1A2. Kolagen typ I vytváří vazby s dalšími molekulami extracelulární matrix (cartilage oligomeric matrix protein, integriny, decorin, kolagen typ V, phosphophoryn a další), čímž zvyšuje integritu pojivové tkáně [1, 2]. Cílem tohoto výzkumu je kompletace molekulárně genetických dat pacientů s postiženou tvorbou kolagenu typ I a porovnání získaných dat s fenotypem těchto jedinců. Studie je zaměřena na analýzu DNA vzorků (s využitím technik polymerázové řetězové reakce (PCR) a Sangerova sekvenování) pacientů s diagnózou osteogenesis imperfecta, typ I IV. Současný stav poznání Genetické změny kolagenu typ I mají za následek bud produkci defektních molekul proteinu, nebo sníženou syntézu konečného produktu. Mutace genů COL1A1 a COL1A2 jsou spojovány s onemocněními, jako jsou osteogenesis imperfecta typ I IV, Ehlersův - Danlosův syndrom (Klasický typ a typ VIIA), Caffeyova nemoc a idiopatická osteoporóza [2]. Osteogenesis imperfecta (OI), typ I IV, je dědičné onemocnění kostí projevující se fragilní kostní tkání, menším vzrůstem pacientů, deformacemi kostí, modrým či šedým zbarvením sklér, poruchou tvorby dentinu (dentinogenesis imperfecta) a dalšími. Výskyt onemocnění je uváděn 1 : živě narozených. Závažnost onemocnění je mírná až letální, přičemž přítomnost klinických znaků se liší nejen mezi jednotlivými typy onemocnění, ale zároveň v rámci pacientů jedné formy OI [3]. První typ OI je ve většině případů způsoben vznikem tzv. STOP kodonu, jehož přítomnost v nukleotidové sekvenci genu vede k předčasnému ukončení transkripce. Vzniklý transkript není inkorporován do molekul kolagenu typ I, což má za následek sníženou produkci proteinu. OI typy II IV mají svůj původ ve strukturálních změnách genů COL1A1 a COL1A2. 80% z nich je způsobeno substitucemi glycinu (nejdůležitější aminokyseliny alpha řetězců, v jejichž sekvenci se vyskytuje v 338 Gly-X-Y repeticích), 20% je výsledkem mutací v oblastech sestřihu genu. Závažnost mutací stoupá směrem k C- konci genu, nebot skládání alpha řetězců do heterotrimeru začíná právě v jejich C-koncové oblasti [3]. V rámci molekuly kolagenu typ I jsou vyčleněny tři oblasti (tzv. Multi ligand binding regions) s vysokou koncentrací mezimolekulárních vazeb. Mutace v první z těchto oblastí (MLBR1) mají obvykle za následek mírný fenotypový projev (OI typy I a IV), zatímco strukturní změny MLBR2 a MLBR3 způsobují vážné a letální formy onemocnění (OI typy II a III) [4]. Uplatnění v biomedicíně a zdravotnictví Molekulárně-genetické analýzy genů kolagenu typ I jsou důležité pro identifikaci co možná největšího mutačního spektra v rámci českých OI pacientů. Získaná data budou porovnávána se světovými databázemi (Online Mendelian Inheritance in Man, Human Genome Mutation Database, Ensembl, GeneCards, atd.) za účelem srovnání etiologie tohoto onemocnění u českých pacientů s dalšími populacemi či etniky. Identifikace DNA změn a jejich klinického projevu může být nápomocné pro zahájení včasné a vhodné léčby pacienta. Zároveň může být užitečným krokem pro predikční diagnostiku jedinců se suspektním defektem kolagenu typ I. V případě negativních výsledků mutační analýzy genů COL1A1 a COL1A2 budou k doplňujícím analýzám vybrány další geny asociované s geny kolagenu typ I. Sémantická interoperabilita v biomedicíně a zdravotnictví
22 16 Hrušková L. Detekce mutací v genech kolagenu typ I Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Aminokyselina Definice: Organická molekula obsahující aminoskupinu i karboxyl.?-aminokyseliny (ve kterých jsou aminoskupina a karboxyl připojeny ke stejnému uhlíku) jsou stavebními kameny proteinů. Zdroj: Alberts B a kol. Základy buněčné biologie. Úvod do molekulární biologie buňky. Ústí nad Labem: Espero Publishing; str. G-2. SNOMED CT: MeSH: D ICD10: nenalezeno Deoxyribonukleová kyselina Definice: Druh nukleové kyseliny, která je základem dědičné informace, viz gen, chromozom. U eukaryontů je uložena převážně v jádře buňky malé množství též v mitochondriích. Je tvořena dvěma dlouhými řetězci navzájem spirálovitě obtočenými, jejichž základními stavebními kameny jsou nukleotidy lišící se přítomností čtyř různých bází, jejichž jedinečné seskupení v řetězci je podkladem informace v DNA uložené, viz genetický kód. Jde o adenin A, guanin G, cytosin C a thymin T. Oba řetězce jsou navzájem doplňkové komplementární na základě zcela přesného párování bází mezi řetězci pomocí vodíkových můstků A tvoří pár s T, G s C, a tak po rozvinutí je ke každému ze samostatných řetězců možné utvořit řetězec nový, zcela totožný s původním řetězcem replikace. To je základ množení a zachování dědičné informace. Zároveň se podle tohoto vzoru tvoří molekuly RNA, které se podílejí na přenosu a dalším zpracování této uložené informace. Synonyma: DNA, DNK Zdroj: dna SNOMED CT: MeSH: D ICD10: nenalezeno Mutace Definice: Změna genetické dědičné informace na úrovni DNA týkající se bud genů, nebo celých chromozomů. Podle místa, které je zasaženo, může či nemusí ovlivňovat funkci buňky a organismu. Vzniká samovolně význam ve vývoji druhů, nebo je způsobena zevními faktory mutageny chemické, fyzikální nebo biologické vlivy. Závažná m. může vést k zániku buňky, k poruše její funkce a někdy též k jejímu zhoubnému bujení, viz kancerogeny. M. zasahující pohlavní buňku může být přenesena na potomstvo. Mutací určitého genu je způsobena řada dědičných nemocí, např. albinismus, fenylketonurie, hemofilie aj. Předávání takto mutovaného genu se řídí příslušnými pravidly dědičnosti, srov. dominantní, recesivní, Mendelova pravidla. Nové metody molekulární biologie jsou významné v diagnóze m. a v budoucnu se mohou uplatňovat i při jejich léčbě, srov. genová terapie. Zdroj: SNOMED CT: (ID nalezeno pro Genetic mutation ) MeSH: D ICD10: nenalezeno Nesmyslný kodon Definice: Jeden ze tří tripletů (UAG, UAA, UGA), které způsobí ukončení proteosyntézy. Synonyma: STOP kodon Zdroj: geneticky_slovnik4_i.htm SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Polymerázová řetězová reakce Definice: Technika sloužící k namnožení určitých úseků DNA mnohokrát opakovaným cyklem polymerace DNA a krátkého zahřátí, při němž se oddělí separovaná komplementární vlákna. Synonyma: PCR Zdroj: Alberts B a kol. Základy buněčné biologie. Úvod do molekulární biologie buňky. Ústí nad Labem: Espero Publishing; str. G-13 SNOMED CT: MeSH: D ICD10: nenalezeno Sémantická interoperabilita v biomedicíně a zdravotnictví
23 Hrušková L. Detekce mutací v genech kolagenu typ I 17 Reference [1] Barnes MA, Weizhong Ch, Morello R, Cabral WA, Weis M, Eyre DR et al. Deficiency of cartilage-associated protein in recessive lethal osteogenesis imperfecta. N Engl J Med. 2006; 355(26): [2] Fahiminiya S, Majewski J, Mort J, Moffatt P, Glorieux FH, Rauch F. Mutations in WNT1 are a cause of osteogenesis imperfecta. J. Med. Genet. 2013; 50: [3] Forlino A, Cabral WA, Barnes AV, Marini JC New perspectives on osteogenesis imperfecta. Nat Rev Endocrinol. 2011; 7: [4] Sweeney, SM, Orgel JP, Fertala A, McAuliffe JD, Turner KR, Di Lullo GA, Chen S, Antipova O, Perumal S, Ala-Kokko L, Forlino A, Cabral WA, Barnes AM, Marini JC, San Antonio JD. Candidate cell and matrix interaction domains on the collagen fibril, the predominant protein of vertebrates. J Biol Chem. 2008;283: Sémantická interoperabilita v biomedicíně a zdravotnictví
24 18 Hynek M. a kol. Statistické metody pro tvorbu časově závislých percentilových grafů... Statistické metody pro tvorbu časově závislých percentilových grafů pro hodnocení velikosti plodu a dataci gravidity na základě longitudinálních dat Martin Hynek 1,2, Jeffrey D. Long 3,4, David Stejskal 2, Jana Zvárová 2,5 1 Gennet, Centrum pro fetální medicínu a reprodukční genetiku, Praha 2 Ústav hygieny a epidemiologie, 1. lékařská fakulta, Univerzita Karlova, Praha 3 Psychiatrické oddělení, Carverova lékařská fakulta, Univerzita v Iowě, Iowa City, IA, USA 4 Oddělení pro biostatistiku, Fakulta veřejného zdraví, Univerzita v Iowě, Iowa City, IA, USA 5 EuroMISE, Evropské centrum pro medicínskou informatiku, statistiku a epidemiologii, Ústav informatiky Akademie věd ČR, Praha Kontakt: Martin Hynek Gennet, Centrum pro fetální medicínu a reprodukční genetiku Adresa: Kostelní 9, Praha 7 E mail: martin.hynek@gmail.com Úvod Hodnocení velikosti plodu a určení přesného gestačního stáří (GS) mají zásadní význam pro správný management těhotenství. Včasné odhalení restrikce růstu nebo makrosomie u plodu může snížit s tím spojenou morbiditu a mortalitu [1, 2]. Znalost přesného GS může zabránit zbytečným peripartálním intervencím [3]. Jak hodnocení velikosti, tak datace gravidity se téměř bezvýhradně opírají o ultrazvukové měření fetálních biometrických parametrů (např. temeno-kostrční délka, obvod hlavičky, délka stehenní kosti apod.), z nichž téměř všechny v průběhu gravidity rostou. K jejich posouzení slouží časově závislé percentilové grafy (referenční grafy), pomocí kterých porovnáme získaný biometrický parametr s očekávanou hodnotou daného parametru v referenční populaci. V literatuře lze nalézt celou řadu postupů vhodných pro konstrukci percentilových grafů. Necht y představuje fetální biometrický parametr a t gestační stáří. Statistickým cílem je odhadnout kvantil, c α (y t), podmíněného rozdělení y (pro dané t) pro stanovené hodnoty α (např. α = 0, 95 pro (100 α) = 95. percentil). Kromě toho požadujeme, aby c α (y t) byl hladkou funkcí t [4]. Při odhadu c α (y t) narážíme na dva hlavní problémy: aproximace distribuce y t a vyhlazení odhadnutých kvantilů v závislosti na t. K řešení těchto problémů bylo navrženo několik možných přístupů, včetně parametrických, semiparametrických a neparametrických metod. Podrobné přehledy a srovnání různých přístupů lze nalézt v literatuře [5, 6, 7, 8]. Naším zájmem může být vytvoření dvou typů referenčních grafů: grafy pro hodnocení velikosti plodu a datační křivky. První jmenované slouží k hodnocení velikosti plodu, zatímco ty druhé k odhadu GS. Je nesprávné používat velikostní percentilové grafy ke stanovení GS. K tomuto účelu je potřeba cíleně vytvořit datační grafy [9]. Jestliže velikostní grafy modelují velikost plodu jako funkci GS, y t, potom datační grafy konstruujeme analogicky jako velikostní grafy s tím rozdílem, že GS modelujeme jako funkci velikosti plodu, t y. Metoda vhodná pro konstrukci percentilových grafů by měla splňovat určité požadavky. V roce 1993 uvedl Altman a Chittyová, že percentilové křivky by se měly hladce měnit s průběhem gestace a vykazovat dobrou shodu s daty. Dále je žádoucí, aby byl statistický model tak jednoduchý, jak je to možné v souladu s těmito požadavky [9]. Experti studijní komise Světové zdravotnické organice (WHO) pro tvorbu nových růstových grafů u dětí (Multicentre Growth Reference Study, MGRS) [8] se shodli na tom, že mezi primární kritéria kladená na metody pro tvorbu percentilových grafů patří schopnost: přesně odhadnout zevní percentily, odhadnout všechny percentily současně takovým způsobem, aby se nemohly křížit, určit Z-skóre a percentily přímo pomocí vzorců, kontinuálně vyhladit křivky v závislosti na věku a Sémantická interoperabilita v biomedicíně a zdravotnictví
25 Hynek M. a kol. Statistické metody pro tvorbu časově závislých percentilových grafů v případě potřeby počítat s šikmostí a špičatostí. Kromě toho jako sekundární kriteria určili, aby metoda umožňovala posoudit shodu modelu s daty, byla jednoduše vysvětlitelná a dobře dokumentovatelná, byla aplikovatelná na různé antropometrické parametry, aby bylo možné vytvořit WHO křivky na základě jednotného přístupu. Většina literatury, která se zabývá tvorbou percentilových grafů, popisuje statistické metody aplikovatelné na data z průřezových studií, tj. kdy každý plod přispívá do reprezentativního výběru pouze jedním měřením. Protože je sběr takových dat snadnější a metodika jejich zpracování jednodušší, většina studií, které byly publikovány v posledních desetiletích, použila ke konstrukci referenčních grafů data z průřezových studií. Nicméně, v současné době máme k dispozici stále častěji data z longitudinálních studií, tj. takových, kdy je každý plod změřen více než jednou, a taková data potom vyžadují odlišnou statickou metodiku. Mezi hlavní odlišnosti patří, že sériová měření jednoho plodu jsou korelována a s tím musí příslušná metoda počítat. Kromě toho je otázkou, jak u takového souboru počítat počet stupňů volnosti (df), a to především v případě, kdy se počet opakovaných měření mezi plody liší [9]. Cílem tohoto článku je sestavit a navrhnout statistickou metodiku vhodnou pro tvorbu časově závislých referenčních grafů plodu na základě longitudinálních dat. Tato metoda bude v budoucnosti použita pro tvorbu referenčních grafů pro hodnocení velikosti plodu a dataci gravidity pro českou populaci, a to na základě rozsáhlého souboru shromážděného během rutinních ultrazvukových vyšetření v Centru fetální medicíny Gennet v Praze. Protože je podstatná část plodů v našem centru vyšetřena během těhotenství více než jednou, zaměříme se v tomto článku na adaptaci stávajících metod pro tvorbu fetálních referenčních grafů na data tohoto typu. Tento článek se zaměřuje výhradně na statistickou metodiku. Mezi neméně důležité body patří problematika velikosti a výběru vzorku, kriterií pro zařazení nebo nezařazení případu do souboru a sběru dat. Nicméně, tyto body nejsou obsahem tohoto sdělení a v jejich případě odkazujeme na příslušnou literaturu [9, 10, 11, 12]. Statistické metody Při hledání vhodné statistické metody, která by splňovala výše zmíněná kritéria, si musíme uvědomit dvě specifika fetální biometrie. Za prvé, je dobře známo, že u plodu průměr biometrických parametrů během těhotenství monotónně roste. Zároveň platí, že variabilita měření mezi jednotlivými plody, kterou lze vyjádřit pomocí směrodatné odchylky (SD), má také tendenci růst (s časem se rozšiřuje). Je proto klíčové při tvorbě modelu počítat nejenom se závislostí průměru na GS, ale také se závislostí SD na GS [9]. Za druhé, z mnoha předchozích prací víme, že rozdělení fetálních biometrických parametrů je blízké normálnímu rozdělení pro jakékoli GS [12]. Kromě toho průměr většiny fetální rozměrů v závislosti na GS roste nelineárně a stejně tak i SD. Proto je nejpoužívanější metodou pro konstrukci fetálních referenčních grafů lineární regrese s využitím zlomkových polynomů (fractional polynomials, FPs) ([13]), pomocí kterých modelujeme zvlášt závislost průměru a zvlášt SD na GS a předpokládáme pro každé GS normální rozdělení měřených parametrů, ale nelineární závislost na GS [4, 13, 14, 15]. Nejprve popíšeme metodu průměru a SD s využitím klasických polynomů (conventional polynomials, CPs) pro data z průřezových studií, následně představíme její modifikaci s využitím FPs a uvedeme metody pro kontrolu shody modelu s daty. Na závěr navrhneme, jak metodiku rozšířit na longitudinální studie. Průřezové studie Metoda průměru a směrodatné odchylky Původní metoda průměru a SD představuje parametrický přístup navržený Altmanem [14] a Roystonem a Wrightem [15]. Metoda vychází z předpokladu, že v každém GS sledují naměřené hodnoty normální rozdělení a modeluje křivky pro průměr a SD v závislosti na GS jako polynomické funkce. Požadovanou kvantilovou křivku lze potom získat pomocí vztahu c α = µ + kσ, (1) kde k je odpovídající kvantil standardizovaného normálního rozdělení a µ a σ představují průměr a SD pro dané GS v referenční populaci. Původní metoda sestává z několika kroků. Nejprve pomocí CPs modelujeme průměr v závislosti na GS. Autoři radí začít s kubickým polynomem a postupně snižovat stupeň polynomu, v případě že se koeficient nejvyššího členu polynomu neliší statisticky významně od nuly. Jakmile vybereme vhodný model pro průměr, pokračujeme modelací variability okolo průměru. Zde autoři metody vychází z úvahy, že pokud vykazují měření ve všech GS normální rozdělení, potom by rezidua ze získaného regresního modelu pro průměr měla mít také normální rozdělení a tedy absolutní hodnoty těchto reziduí polonormální rozdělení. Průměr polonormálního standardizovaného rozdělení je roven 2/π. Necht jsou modifikovaná absolutní rezidua absolutní hodnoty reziduí násobené π/2. Tedy, jestliže získáme regresní model modifikovaných absolutních reziduí v závislosti na GS, budou hodnoty předpovězené tímto modelem odhadem SD reziduí pro dané GS a tím i odhadem pro y. Podobně jako při modelaci křivky pro průměr, i zde používáme k modelaci závislosti polynomickou regresi. Sémantická interoperabilita v biomedicíně a zdravotnictví
26 20 Hynek M. a kol. Statistické metody pro tvorbu časově závislých percentilových grafů... Konečně, protože SD v závislosti na GS roste (heteroskedasticita), měli bychom následně znovu vyhladit křivku pro průměr a SD s použitím vážené regrese pomocí metody nejmenších čtverců, kdy jako váhy použijeme převrácenou hodnotu druhé mocniny odhadovaných SD pro dané GS [16]. Nicméně, Altman a Chittyová uvádějí, že efekt na výslednou křivku je téměř vždy nevýrazný [9]. Zlomkové polynomy CPs, které původní metoda průměru a SD podle Altmana a Chittyové používá, trpí několika dobře známými omezeními. Polynomy nízkého řádu nabízejí jen omezenou škálu tvarů a polynomy vysokého řádu nemusí dobře odpovídat datům na okrajích pozorovaného období. Kromě toho, polynomy postrádají asymptoty [13]. Proto v roce 1994 předložili Royston a Altman rozšířenou rodinu polynomů nazvaných zlomkové polynomy (fractional polynomials, FPs) [13]. FPs jsou podobné CPs v tom, že jejich členy jsou mocninné funkce nezávislé proměnné a současně CPs jsou speciálním případem FPs. Liší se ale v tom, že exponenty ve členech FPs mohou nabývat záporných hodnot a zlomků. Obvykle jsou možné exponenty vybírány z malé, předem stanovené množiny celočíselných a neceločíselných hodnot: S = { 3; 2; 1; 0, 5; 0; 0, 5; 1; 2; 3}, kde 0 představuje transformaci pomocí přirozeného logaritmu. Prvky množiny S jsou hlavní hodnoty Tukeyho žebříčku mocnin, který je užíván pro všeobecné řešení problémů s prokládáním křivek [17], je možné využít i jiné sady. Mezi atraktivní vlastnosti FPs patří parsimonie (můžeme docílit podobné shody modelu s daty jako u CPs, ale s méně členy polynomu), široká škála tvarů křivek a schopnost aproximovat asymptoty [4, 18]. Obecná definice FP m-tého řádu (FPm) a s exponenty p = (p 1... p m ) je potom dána vztahem φ (t; p) = β 0 + φ m (t; p) = m β j h j (t), (2) j=0 kde h 0 (t) = 1 a kde { t p j pro p h j (t) = j p j 1 (3) h j 1 (t) log t pro p j = p j 1 pro j = 1,..., m a t 0 log e (t) [4, 13]. Dalším omezením je t > 0, abychom zajistili, že FP transformace bude vždy definována. Například FP prvního řádu (FP1) pro p 1 = 0 je β 0 + β 1 log t, FP druhého řádu (FP2) s p 1 = 2 a p 2 = 1 je β 0 + β 1 t 2 + β 2 t a FP třetího řádu (FP3) s p = (0; 2; 2) je β 0 + β 1 log t + β 2 t 2 + β 3 t 2 log t. FPs s m 2 nabízejí širokou škálů nelineárních (a lineárních) křivek. Proto jsou v praxi jen velmi zřídka potřebné FPs řádu vyššího než druhého [4]. FP1 funkce jsou vždy monotónní, zatímco FP2 funkce mohou být monotónní nebo nemonotónní (konvexní/konkávní) a jako speciální případ obsahují kvadratický polynom (p 1 = 1, p 2 = 2). Růst plodu je z biologické podstaty monotónní. Zdá se proto logické, že pro tvorbu fetálních referenčních grafů by stačily FP1 modely. Avšak FP2 funkce mohou mít také svůj význam, především v případě, kdy vývoj sledujeme v poměrně dlouhém časovém období. Vzhledem k tomu, že FP2 křivky jsou výrazně bohatší, co se týče možných tvarů, obvykle při tvorbě fetálních referenčních grafů používáme jak FP1, tak i FP2 funkce. Předchozí zkušenosti s FPs nám také ukazují, že v mnoha případech byly právě FP2 modely vybrány jako ty nejlepší při konstrukci fetálních percentilových grafů [19, 20, 21]. Při použití FPs regrese se nabízí otázka, jak vybereme mezi možnými kandidáty ten nejlepší model (modely) pro naše data. Obecně předpokládáme, že FP model je typicky odhadován pomocí maximální věrohodnosti (ML). Klíčovou charakteristikou je potom -2 krát nejvyšší hodnota věrohodnostní funkce, označovaná jako deviance. Jestliže jsou všechny kandidátní FP modely stejného řádu (např. FP1), je potom nejlepší model jednoduše ten, který má nejnižší devianci [4]. Ale pokud chceme porovnávat FP modely různého řádu, potřebujeme odlišný postup. Důvodem je fakt, že deviance bude u komplexnějšího modelu vždy nižší, a to i v případě, že je do modelu přidán bezcenný prediktor [18]. Tím pádem by byl složitější model upřednostněn před modelem jednodušším. Proto, pokud máme rozhodovat mezi rozdílně složitými modely, vycházejí Royston a Sauerbrei [4] z faktu, že rozdíl deviancí mezi nulovým modelem s [β 1,..., β m ] T = 0 a FP modelem m-tého řádu má přibližně χ 2 rozdělení o 2m stupních volnosti. Podobně, rozdíl deviancí mezi FPm a FP(m 1) modely sleduje přibližně χ 2 rozdělení o dvou stupních volnosti pro případ nulové hypotézy, že dodatečné β v FPm modelu je nula [4]. Pro srovnání modelů můžeme tedy použít test poměrem věrohodností (likelihood ratio test, LRT). Původní sekvenční postup navržený Roystonem a Altmanem [13] postupně srovnával FP2 model s FP1, poté FP1 s lineárním modelem (p 1 = 1) a konečně lineární model s nulovým modelem (β 1 = 0). Nicméně, tento postup může výrazně zvýšit pravděpodobnost chyby I. druhu v případě, že vliv t jako prediktora je nevýznamný a může někdy dát nejednoznačný výsledek [4]. Proto Royston a Sauerbrei tento postup nedoporučují a navrhují jiný, uzavřený postup zvaný RA2 [4], který zachovává pravděpodobnost chyby I. druhu na zvolené hladině významnosti α (typicky α = 5%). Postup je následující: 1. Otestuj nejlepší FP2 model proti nulovému modelu (všechna β j>0 = 0) na hladině významnosti α a se čtyřmi stupni volnosti. Jestliže je test statisticky nevýznamný, je vliv t jako prediktora nesignifikantní. V opačném případě pokračuj. 2. Otestuj nejlepší FP2 model proti lineárnímu modelu (p 1 = 1) s použitím třech stupňů volnosti. Jestliže test není statisticky signifikantní, je finální model lineární. V opačném případě pokračuj. Sémantická interoperabilita v biomedicíně a zdravotnictví
27 Hynek M. a kol. Statistické metody pro tvorbu časově závislých percentilových grafů Otestuj nejlepší FP2 model proti nejlepšímu FP1 modelu s použitím dvou stupňů volnosti. Jestliže test není statisticky signifikantní, je finální model FP1. V opačném případě je finální model FP2. Metoda průměru a SD s použitím FPs je prováděna analogicky, jak byla výše popsána s jediným rozdílem, že místo CPs použijeme FPs pro modelaci závislosti průměru a SD na GS, y t. Hodnocení shody modelu s daty Bylo opakovaně publikováno [6, 8, 9, 12], že je naprosto nezbytné posoudit, jakým způsobem se finální model shoduje s daty. K tomuto účelu byla navržena celá řada diagnostických nástrojů. Zde předkládáme seznam nejčastěji zmiňovaných metod, včetně těch, které doporučuje MGRS komise WHO [8]: vizuální zhodnocení tvaru kvantilových křivek vynesených do grafu zároveň s daty, graf empiricky odhadnutých a vyhlazených kvantilů vynesených zároveň do jednoho grafu, srovnání pozorovaných a očekávaných četností nad a pod příslušnými kvantily, bodový diagram distribuce reziduí vyjádřených formou Z-skóre, normální Q-Q diagram reziduí vyjádřených formou Z-skóre, detrendovaný normální Q-Q diagram (worm plot, červí diagram) reziduí vyjádřených jako Z-skóre, tj. do grafu vynášíme empirické kvantily mínus normální kvantily proti normálním kvantilům, testy normality reziduí vyjádřených formou Z-skóre nebo jejich kombinace, např. Q-statistika [22] (kombinace testů na čtyři momenty rozdělení, modifikovaných testů podle D Agostina [23] a testu podle Shapira a Wilka), graf, ve kterém jsou vynesena vyhlazená rezidua jako plná čára společně s 95% intervalem spolehlivosti. Tyto grafy pomáhají zachytit oblasti vysvětlující proměnné, ve kterých se model nedostatečně shoduje s daty. Royston a Sauerbrei [4] prezentovali své zkušenosti s vyhlazením pomocí lokálně lineární regrese (univariate runningline smoother), který do programu Stata implementoval Sasieni [24]. V prostředí R lze podobného výsledku dosáhnout pomocí Friedmanova supervyhlazovače (supersmoother) [25]. Tyto zmíněné nástroje mohou být použity na celou finální křivku po jejím vyhlazení v závislosti na GS nebo lokálně pro dané GS. Rozšíření na longitudinální studie Longitudinální soubor získáme pozorováním daného jedince opakovaně v čase [26]. Jak jsme již zmínili, cílem naší plánované studie je vytvořit fetální percentilové grafy pro českou populaci na základě dat z našeho centra. Některé plody jsou v průběhu těhotenství vyšetřeny pouze jednou. Avšak u značné části plodů provádíme měření více než jednou (až cca desetkrát). Zacházet s takovýmto souborem jako s průřezovou studií by bylo zjevně chybné, nebot sériová měření jednoho plodu jsou výrazně korelována a efektivní velikost souboru odpovídá spíše celkovému počtu plodů než celkovému počtu měření. V takovém případě je nezbytný předpoklad klasické regresní analýzy o nezávislosti pozorování zcela jistě porušen. Jestliže je výběr plodů náhodný, lze předpokládat, že měření mezi jednotlivými plody jsou nezávislá, ale měření prováděná v rámci jednoho plodu jsou závislá. Při analýze průřezových dat se soustřed ujeme na variabilitu a rozdíly mezi jednotlivými subjekty. Ale v případě analýzy longitudinálních dat je nutné zahrnout i variabilitu v rámci jednotlivých subjektů. Aplikovat metody klasické regresní analýzy na longitudinální data je nesprávné, nebot nereflektování variability v rámci subjektu vede k vychýlených odhadům středních chyb a z toho plynoucích statistik. Je tedy zřejmé, že klasická regresní analýza je pro longitudinální data nevhodná a je nutné nalézt adekvátní alternativní metodu [18]. Lineární smíšené regresní modely Lineární smíšené regresní modely (linear mixed effect regression, LMER) představují metodu pro analýzu víceúrovňových dat, mezi která longitudinální data patří [27]. Opakovaná měření na jednom subjektu jsou korelována. Tento fakt zohledňují v LMER modelech členy označované jako náhodné efekty, které odrážejí rozdíly mezi křivkami jednotlivých subjektů. LMER obsahuje také pevné efekty, které jsou analogické koeficientům v klasické lineární regresi. Ty jsou konstantní mezi jednotlivci a odrážejí změny na úrovni skupin [18]. Kombinace pevných a náhodných efektů dala metodě LMER jméno. Náhodné efekty můžeme také chápat jako rozdíl mezi regresní křivkou daného jednotlivce a regresní křivkou celé skupiny. Představíme-li si lineární závislost, můžeme mít dva různé náhodné efekty, které ale mohou být korelovány: náhodný absolutní člen (rozdíl mezi absolutním členem regresní křivky jednotlivce a skupiny) a náhodnou směrnici (rozdíl mezi sklonem křivky jednotlivce a skupiny). V případě fetální biometrie se zdá adekvátní brát do úvahy oba náhodné efekty, tj. model s náhodným absolutním členem a směrnicí. Biologická povaha růstu plodu totiž naznačuje, že se plody nejenom liší počáteční velikostí, se kterou vstupují do pozorovacího období (ta je vyjádřena absolutním členem), ale i rychlostí růstu (tu odráží směrnice). Mezi výhody LMER patří, že všechny subjekty nemusí být měřené ve stejném časovém okamžiku ani Sémantická interoperabilita v biomedicíně a zdravotnictví
28 22 Hynek M. a kol. Statistické metody pro tvorbu časově závislých percentilových grafů... mít stejný počet měření. Časová nerovnoměrnost je právě charakteristika našeho souboru, nebot jednotlivé plody se liší počtem provedených měření (od jednoho do cca deseti) a čas (GS) měření se mezi jednotlivými plody také liší (některé v kratších časových intervalech, jiné v delších časových intervalech). V tomto pohledu představuje LMER optimální přístup, protože LMER má mimo jiné tyto vlastnosti: LMER se dokáže vypořádat s chybějícími pozorováními. Subjekty, pro které je k dispozici alespoň jedno pozorování, mohou být zahrnuty do analýzy. LMER představuje metodu velmi flexibilní, pokud jde o strukturu dat. Časy pozorování se mohou mezi jednotlivými subjekty lišit, stejně tak i časová vzdálenost mezi různými pozorováními nemusí být stejná. LMER dokáže kontrolovat počet a charakter členů potřebných pro modelaci závislosti na čase. Lze použít CPs, FPs a řadu dalších transformací (např. spliny). Vrátíme-li se k charakteristikám LMER, předpokládejme, že y ij je pozorování i-tého objektu (i = 1,..., N) v j-tém časovém bodě (j = 1,..., n i ), m je počet prediktorů pevných efektů, a l je počet prediktorů náhodných efektů (u obou nepočítáme absolutní člen). Obecná definice klasického LMER modelu je potom dána [28, 29] y i = X i β + Z i b i + ε i, (4) kde y i je časový vektor i-tého jedince o rozměrech n i 1, X i je známá matice plánu pro pevné efekty rozměrů n i (m+1), β je vektor o rozměrech (m+1) 1 obsahující pevné, ale neznámé regresní koeficienty, Z i je známá matice plánu pro náhodné efekty rozměrů n i (l + 1), b i je vektor o rozměrech (l+1) 1 obsahující neznámé náhodné efekty, a ε i je vektor o rozměrech n i 1 obsahující náhodné složky. Tedy, pokud jsou prediktory transformace času (t) pomocí FPs, X i = Z i = y i = y i1. y ij. y ini, ε i = 1 t p1 i1... t pm i t p1 in i... t pm in i 1 t p1 i1... t p l i t p1 in i... t p l in i ε i1. ε ij. ε ini, β =, b i =, (5) β 0 β 1. β m b 0i b 1i. b li, (6). (7) Sloupce matice Z i jsou typicky podmnožinou sloupců matice X i, tedy l m. Pro FP1 je obvyklé, že l = m = 1 a že jsou specifikovány náhodný absolutní člen a náhodná směrnice. Typické předpoklady normality a další předpoklady lze shrnout jako b i N (0, G), ε i N (0, R i ), s b i ε i, (8) tj. náhodné složky ε i a náhodné efekty b i jsou pro daného jedince vzájemně nezávislé. Dále předpokládáme, že R i = σεi 2 ni, kde I ni je jednotková matice o rozměrech n i n i a G je neznámá kovarianční matice pro náhodné efekty o rozměrech (l + 1) (l + 1) a s nezápornými variancemi na diagonále. Pevné efekty a jednotlivé komponenty variability jsou typicky odhadovány pomocí ML nebo modifikované maximální věrohodnosti (restricted maximum likelihood, REML) [18, 28]. Například, jednoduchý lineární LMER model s náhodným absolutním členem a směrnicí je pro FP1 s p 1 = 1 (l = m = 1) dán jako Zlomkové polynomy y ij = (β 0 + b 0i ) + (β 1 + b 1i )t ij + ε ij. (9) Jak jsme výše ukázali, lze FPs přímo začlenit do LMER. Zároveň jsme již zmínili, že charakter růstu plodu předpokládá model s náhodným absolutním členem a směrnicí. Lze dokázat, že korelace (kovariance) mezi náhodnými efekty předpokládá, že variabilita fetálních biometrických parametrů může v čase (GS) růst, což je vlastnost důležitá pro náš model. V případě FP2 modelů nebo i modelů vyšších řádů je nutné se rozhodnout, kolik náhodných efektů bude do modelu začleněno. Velké množství náhodných efektů může někdy vést k problémům s odhadem modelu a nižší efektivitě odhadovacího algoritmu, především v případě, kdy je soubor malý a/nebo je omezený počet pozorování. Pokud se rozhodujeme mezi modely s různým počtem pevných efektů, je důležité, aby porovnávané modely měly stejný počet náhodných efektů. V opačném případě nelze jednoznačně rozhodnout, zda volený model je lepší z důvodu zvolených pevných efektů nebo zvolených náhodných efektů. Tedy, pokud porovnáváme FP1 a FP2 modely, měly by oba mít pouze dva náhodné efekty. Protože v našem případě očekáváme právě tento typ srovnávání, budeme dále uvažovat modely s právě dvěma náhodnými efekty. Obecně je FP1 pro LMER dán jako y ij = (β 0 + b 0i ) + (β 1 + b 1i )t p1 ij + ε ij. (10) FP2 mají dva exponenty, p 1 a p 2, kdy platí, že p 1 p 2. V případě, že jsou exponenty rozdílné, p 1 < p 2, má FP2 se dvěma náhodnými efekty formu y ij = (β 0 + b 0i ) + (β 1 + b 1i )t p1 ij + β 2t p2 ij + ε ij, (11) Sémantická interoperabilita v biomedicíně a zdravotnictví
29 Hynek M. a kol. Statistické metody pro tvorbu časově závislých percentilových grafů zatímco v případě stejných exponentů, p 1 = p 2, je model dán jako y ij = (β 0 + b 0i ) + (β 1 + b 1i )t p1 ij + β 2t p2 ij log t ij + ε ij. (12) V těchto uvedených FP2 modelech jsou náhodné směrnice dány vždy prvním typem FP transformace (tj. p 1 ). Nicméně, stejně tak snadno by náhodné směrnice mohly vycházet z druhého typu FP transformace (tj. z p 2 ). Kromě toho je nutné poznamenat, že pokud srovnáváme mnoho modelů, může mít p 1 rozdílné hodnoty v FP1 a FP2 modelech, jak uvádíme níže. V případě čistě explorativní analýzy budeme tedy srovnávat všechny FP1 a FP2 modely. To znamená, že pro uvedenou množinu S máme k dispozici devět FP1 = 45 FP2 modelů. Pro odhad parametrů těchto 54 modelů dáváme přednost odhadu pomocí ML spíše než pomocí REML, protože modely se liší pouze v počtu pevných efektů [18, 28]. modelů a (9+1)! 2!(9 1)! Porovnávání více modelů za pomoci Akaikeho informačního kritéria Výběr nejvhodnějšího modelu (nebo podskupiny modelů) mezi celkem 54 odhadnutými FP1 a FP2 modely je náročný úkol. Jak jsme již zmínili, v případě průřezových studií a klasické lineární regrese navrhli Royston a Sauerbrei [4] použít LRT. V případě longitudinálních studií s využitím FPs a LMER je aplikace LRT problematická, nebot porovnáváme navzájem mnoho modelů se stejným počtem parametrů a LRT lze použít pouze pro vnořené modely. Proto pro výběr vhodného modelu z našeho souboru 54 LMER modelů navrhujeme zcela jinou statistickou strategii známou jako porovnávání více modelů (multimodel inference) [30]. Tato strategie je rutinně využívána k porovnávání modelů v ekologii a biologii volně žijících zvířat [31, 32] a byla nedávno prezentována jako vhodná metoda pro analýzu longitudinálních dat v behaviorálních vědách [18] a v medicíně [33, 34]. Porovnávání více modelů je statistická koncepce vycházející z nových informačně-teoretických (I-T) postupů (teorie informace). Tyto I-T metody umožňují vybrat ten nejvhodnější model z a priori zvolené množiny konkurujících si modelů, tyto modely ohodnotit a seřadit, co se týče vhodnosti, a zároveň odhadnout nejistotu ve výběru modelu [35]. Tyto postupy se nazývají informačně-teoretické, protože jsou založeny na Kullbackově-Leiblerově (K-L) teorii informace. K-L informace představuje míru informace, která se ztratí, jestliže je daný model použitý jako aproximace skutečné reality. Model představující vlastní realitu je ve skutečnosti neznámý a proto je naším cílem vybrat z množiny možných modelů ten, který minimalizuje ztrátu K-L informace (tj. model, který je realitě nejbližší). V roce 1973 Akaike [36] nalezl formální vztah mezi K-L informací a teorií věrohodnosti. Zjistil, že maximalizovaná logaritmická věrohodnostní funkce je vychýleným odhadem K-L informace a že míra tohoto vychýlení je přibližně rovna počtu odhadovaných parametrů v aproximujícím modelu. Proto, očekávanou relativní K-L informaci lze odhadnout pomocí Akaikeho informačního kritéria (AIC), které je definováno jako AIC = deviance + 2K = 2 log(l(ˆθ y)) + 2K, (13) kde log(l(ˆθ y) je hodnota maximalizované logaritmické věrohodnostní funkce mezi neznámými parametry (θ) pro daná data y a K je počet odhadovaných parametrů. AIC penalizuje devianci o dvakrát počet odhadovaných parametrů, čímž působí proti zlepšení modelu prostým přidáním bezcenného prediktoru. Pro malé výběry bychom měli používat modifikované AIC (AICcorrected, AICc)([37]), které je v případě longitudinálních dat dáno AICc = AIC + 2 K (K + 1) ( N ), (14) i n i K 1 kde suma představuje celkový počet všech časových bodů pozorování. S narůstající velikostí výběru se AICc blíží AIC. Z tohoto důvodu by AICc mělo být používáno u malých i velkých výběrů [18]. Na základě AICc lze tedy seřadit modely podle jejich relativní shody modelu s daty a podle jejich hodnověrnosti. Jestliže spočítáme AICc pro každý z H modelů v naší a priori vybrané množině, je potom model s nejnižším AICc nejlépe aproximujícím modelem, tj. modelem, který je nejblíže neznámé realitě. Hodnota AICc sama o sobě interpretovatelná není, nebot představuje relativní shodu modelu s daty. Relativní je proto, že ve skutečnosti neznáme pravý model a nemůžeme tedy ani určit vzdálenost pravého modelu od našeho kandidátního modelu. Nicméně, můžeme srovnávat vzájemně si konkurující modely mezi sebou a měřit, o kolik lepší je náš nejlépe aproximující model ve srovnání s jiným aproximujícím modelem, tj. můžeme měřit velikost efektu. K tomuto účelu bylo navrženo několik nástrojů, které nám mají pomoci při výběru modelu pomocí AIC (a AICc). Nejjednodušším způsobem je zjistit rozdíl mezi AICc každého z konkurujících si modelů a AICc nejlepšího modelu. Necht h, představuje rozdíl pro h-tý model. Potom h = AICc min AICc h, (15) kde h = 1,..., H, H je počet modelů a AICc min je nejmenší AICc hodnota v množině H modelů. Nejlepší model má = 0 a nejhorší model má maximální hodnotu. Je možné, že pro jakoukoli množinu FP modelů existuje podmnožina modelů s relativně podobně dobrou shodou modelu s daty a podskupina s podobně špatnou shodou. Není stanoven žádný jednoznačný cutoff, jak odlišit hodnověrné a nehodnověrné podskupiny modelů. Ale jako orientační doporučení nám může sloužit: modely s h 2 mají výraznou podporu, modely s 4 h 7 mají výrazně nižší podporu a modely s h > 10 nemají podporu v podstatě žádnou [31]. Sémantická interoperabilita v biomedicíně a zdravotnictví
30 24 Hynek M. a kol. Statistické metody pro tvorbu časově závislých percentilových grafů... Dalším nástrojem pro výběr modelu je tzv. váha jistoty (nebo též Akaikeho váha) [31]. Tuto váhu jistoty pro h-tý model, W h, lze chápat jako h vyjádřenou na pravděpodobnostní škále, W h = exp( 0.5 h) H h exp( 0.5 h). (16) Pokud máme data, množinu konkurujících si modelů a neznámý skutečný model, W h nám potom představuje pravděpodobnost, že h-tý model je nejlepším aproximujícím modelem [18]. Model s nejvyšším W je nejlepším aproximujícím modelem, ale můžeme mít více modelů s podobně vysokými hodnotami. Stejně jako v případě, ani zde není dán jednoznačný cutoff pro hodnověrnost modelu. Nicméně, jako rozumné hranice byly navrženy W h = 0, 90 a W h = 0, 95 [31]. V případě, že nemáme žádný model s takto vysokou pravděpodobností, je vhodné vytvořit podmnožinu modelů s nejvyššími hodnotami W, u nichž součet pravděpodobností dosahuje 0,90 nebo 0,95. Třetím vyjádřením velikosti efektu je poměr jistot [31], který vyjadřuje, jak mnohem pravděpodobnější je nejlepší model ve srovnání s daným modelem. Předpokládejme, že E h je poměr jistot pro h-tý model. Potom E h = W max W h, (17) kde W max je nejvyšší váha jistoty v dané množině modelů. Jelikož je E h poměr pravděpodobností, lze ho též chápat jako šanci, že model h není nejlepším aproximujícím modelem. Nejlepší model má E = 1 a všechny ostatní modely mají hodnoty větší. Poté co jsme uvedli tři nástroje pro porovnávání modelů založené na AICc, je nutné zmínit i některá úskalí. Za prvé, jak jsme již dříve uvedli, vzájemně srovnávané modely by se neměly lišit v počtu náhodných efektů nebo přidružených komponent variability, jinak nám AICc může být při výběru modelů vychýleným vodítkem [38, 39]. Druhým varováním je fakt, že ačkoli AICc bere výslovně do úvahy počet prediktorů, přesto má tendenci preferovat složitější modely [40]. Koncepce vycházející z AICc (a AIC) není konzistentní v tom smyslu, že zvýšení rozsahu výběru nevede ke zvýšení pravděpodobnosti nalezení modelu odpovídají vlastní realitě. To samozřejmě není problém, jestliže výzkumník věří, že skutečný pravý model je nekonečně komplexní a že nástroje založené na AICc mu pomohou nalézt nejlepší aproximující model z množiny možných modelů. Nicméně, v případě že výzkumník předpokládá, že skutečný model lze odhalit, mohou tyto nástroje vést k preferenci modelu, který se příliš přizpůsobuje datům (tzv. overfitting), tj. k volbě modelu s příliš mnoho parametry. Tím pádem filozofický záměr výzkumníka může ovlivnit stupeň, s jakým budou I-T metody přínosné. Jestliže je cílem nalézt pravý model, lze využít alternativní indexy (viz [41]). Statistická strategie porovnávání více modelů je přirozeným způsobem jak pracovat s více hypotézami o možných modelech zároveň, což je stav, se kterým se často setkáváme v aplikovaném medicínském výzkumu, obzvláště v případě observačních studií. Nejprve tedy a priori vybereme množinu možných modelů a odhadneme jejich parametry. Následně s pomocí AICc seřadíme modely co se týče jejich hodnověrnosti a zhodnotíme relativní velikosti efektů pomocí zmíněných nástrojů. Při tomto si je potřeba uvědomit jeden velmi důležitý fakt. Výsledek velmi závisí na tom, které modely vybereme do dané množiny kandidátních modelů, protože i v případě, že žádný z nich není kvalitní, stejně jsou modely zhodnoceny a seřazeny. Vždy bychom proto měli zhodnotit globální hodnotu modelu (modelů) vybraného jako nejlepší. K tomuto účelu používáme standardní statistické nástroje, tj. indexy absolutní velikosti efektu (např. R 2 ) a analýzu reziduí z regresního modelu. Koncepce porovnávání více modelů se staví do protipólu k tradiční a používanější metodě testování nulové hypotézy (null hypothesis statistical testing, NHST). Vzhledem k tomu, že koncepce porovnávání více modelů může být pro mnoho čtenářů nová, dovolujeme si zdůraznit některé z hlavních odlišností nástrojů využívajících AICc ve srovnání s NHST. V rámci paradigmatu I-T metod jsou zavedené frekventistické principy aplikovatelné při volbě modelu spíše než při rozhodování o hypotézách, jak je tomu v případě NHST. Z tohoto důvodu není v prezentované koncepci porovnávání více modelů podstatné, že provádíme mnohonásobná porovnávání. AICc může porovnávat několik modelů současně, zatímco NHST může vždy hodnotit pouze dva modely najednou. AICc lze použít pro srovnání vnořených i nevnořených modelů. AICc nepoužívá pro rozhodování o modelech arbitrárně stanovené hranice, jako je např. p 0, 05 v NHST. Modely lze jednoduše seřadit a rozhodování je založeno na pořadí bez nutnosti zahození modelu, protože je pod hranicí statistické významnosti. Na základě AICc lze jasně vyjádřit velikost efektu, zatímco na základě NHST ne. AICc nevyžaduje předpoklad, že alespoň jeden z kandidátních modelů je pravdivý, zatímco NHST ano (v případě NHST se předpokládá, že nulový model je pravdivý). Nástroje jako je poměr jistot dovolují určit jistotu, že daný model je nejlepší, zatímco NHST toto neumožňuje. Tvorba fetálních percentilových grafů Poté co jsme prezentovali několik metod, pokusme se shrnout celý postup pro konstrukci fetálních referenčních křivek na základě longitudinálních dat. Základem Sémantická interoperabilita v biomedicíně a zdravotnictví
31 Hynek M. a kol. Statistické metody pro tvorbu časově závislých percentilových grafů je metoda průměru a SD, kdy modelujeme průměr a SD fetálního biometrického parametru y v závislosti na t (GS) a kdy pro vyjádření vztahu y t používáme FP funkce. Na základě našeho souboru odhadneme množinu 54 FP1 a FP2 LMER modelů. Následně porovnáme všechny modely za pomoci některého z I-T nástrojů (např. váhy jistoty) a vybereme z množiny nejlepší aproximující model. Poté co takto získáme finální model, pečlivě zhodnotíme shodu daného modelu s našimi daty. Na závěr vytvoříme na základě zvoleného modelu vlastní percentilové křivky. Závěr Konstrukce fetálních referenčních grafů vyžaduje použití adekvátní statistické metody. V opačném případě mohou být vytvořené percentily nepřesné a mohou vést k chybných klinickým závěrům ohledně vývoje plodu. Předchozí zkušenosti z mnoho prací nám říkají, že rozdělení fetálních biometrických parametrů je pro jakékoli GS blízké normálnímu rozdělení. Proto je nejpoužívanější metodou pro tvorbu fetálních percentilových grafů parametrická metoda průměru a SD s využitím FPs, kdy modelujeme závislost průměru a SD daného biometrického parametru na GS. Tato práce prezentuje, jakým způsobem může být stávající metodika rozšířena na longitudinální studie pomocí FPs a LMER. Prezentovaný postup zahrnuje odhad FP1 a FP2 modelů pomocí ML a výběr nejlepšího modelu s využitím strategie porovnávání více modelů za pomoci AICc a s ním souvisejících nástrojů. Poděkování Tato práce byla podpořena grantem Univerzity Karlovy v Praze č. SVV Kĺıčová slova Deviance Definice: Deviance je statistika vyjadřující míru shody modelu s daty, v případě že je model odhadován pomocí maximální věrohodnosti. Představuje zobecnění myšlenky použití součtu čtverců reziduí v metodě nejmenších čtverců na případy, kdy právě odhadujeme parametry modelu pomocí maximální věrohodnosti. Deviance je pro daný model na základě souboru dat y definována jako 2 log(l(ˆθ y)) kde log(l(ˆθ y)) představuje hodnotu maximalizované logaritmické věrohodnostní funkce mezi neznámými parametry (θ) pro daná data y. Zdroj: Nelder JA, Wedderburn RWM. Generalized linear model. J R Statist Soc A 1972; 135: SNOMED CT: nenalezen MeSH: nenalezen ICD10: nenalezen Kullbackova-Leiblerova Informace Definice: Tento pojem zavedli S. Kullback a R. A. Leibler v roce Necht f představuje plnou realitu či skutečnost a g označuje aproximující model, rozdělení pravděpodobnosti. Kullbackova-Leiblerova Informace je potom míra ( vzdálenost ) mezi konceptuální realitou, f, a aproximujícím modelem, g, a je definována pro spojité rozdělení jako integrál I(f, g) = f(x) log ( f(x) g(x θ) ) dx kde f a g jsou n-dimensionální rozdělení pravděpodobností. K-L informace, označená I(f, g), představuje míru informace, kterou ztrácíme, když model g použijeme k aproximaci reality, f. Tedy nejlepší model je ten, který ztrácí nejméně informace ve srovnání s ostatními srovnávanými modely, neboli ten, který minimalizuje I(f, g) pro množinu srovnávaných modelů. Synonyma: K-L informace, Kullbackova-Leiblerova divergence, informační divergence, informační zisk, relativní entropie Zdroj: Burnham KP, Anderson DP. Multimodel inference: Understanding AIC and BIC in model selection. Sociol Methods Res 2004; 33(2): SNOMED CT: nenalezen MeSH: nenalezen ICD10: nenalezen Akaikeho informační kriterium Definice: Akaikeho informační kritérium je měřítkem relativní kvality statistického modelu pro daný výběr a poskytuje prostředek k výběru modelu. AIC vychází z Kullbackovy-Leiblerovy teorie informace: nabízí relativní odhad ztráty informace, když použijeme daný model k vyjádření procesu, který generuje data. Kromě toho lze AIC chápat jako nestranný odhad prediktivní přednosti, což je schopnost modelu předpovědět nová data. Toho je dosaženo tak, že AIC balancuje mezi shodou modelu s daty a komplexitou modelu. AIC = deviance + 2K = 2 log(l(ˆθ y)) + 2K, kde K je počet parametrů odhadovaného modelu a L je maximalizovaná hodnota věrohodnostní funkce příslušného modelu. Máme-li množinu kandidátních modelů pro naše data, má potom preferovaný model Sémantická interoperabilita v biomedicíně a zdravotnictví
32 26 Hynek M. a kol. Statistické metody pro tvorbu časově závislých percentilových grafů... nejnižší hodnotou AIC. AIC zhodnocuje vhodnost modelu (vyjádřené pomocí věrohodnostní funkce), ale zároveň jsou modely penalizovány navyšováním AIC v závislosti na počtu odhadovaných parametrů. Tato penalizace působí proti přílišnému se přizpůsobení modelu datům (tzv. overfitting), nebot zvýšení počtu parametrů v modelu vždy zlepší (sníží) devianci. AIC nabízí metodu, jak lze srovnávané modely zhodnotit a seřadit a určit relativní velikost efektu modelu, pokud jde o vzdálenost modelu od reality. Synonyma: AIC Zdroj: 1. Long J. Longitudinal data analysis for the behavioral sciences using R. Thousand Oaks, Calif.: Sage, Akaike H. Information theory as an extesion of the maximum likelihood principle. In Petrov BN, Csaki F (Eds). Second international symposium on information theory. Budapest, Hungary: Akademiai Kiado, Burnham KP, Anderson DR, Huyvaert KP. AIC model selection and multimodel inference in behavioral ecology: some background, observations, and comparisons. Behav Ecol Sociobiol 2011; 65: SNOMED CT: nenalezen MeSH: nenalezen ICD10: nenalezen Stupeň volnosti Definice: V kontextu testování poměrem věrohodností představuje počet stupňů volnosti parametr, který určuje dané referenční χ 2 rozdělení použité při testování hypotéz. Počet stupňů volnosti je dán rozdílem v počtu parametrů, o které se liší jednodušší redukovaný model a komplexnější plný model. Tento parametr je používaný i v dalších pravděpodobnostních rozděleních vztahujících se k χ 2 rozdělení, jako je Studentovo rozdělení a Fisherovo rozdělení. V jiné souvislosti se počet stupňů volnosti vztahuje k lineárně nezávislým členům používaných při výpočtu součtu čtverců na základě n nezávislých pozorování. Pojem stupeň volnosti zavedl R. A. Fisher v roce Synonyma: df Zdroj: 1. Fisher RA. Applications of Student s distribution. Metron 1925; 5, Dodge Y. The Concise Encyclopedia of Statistics. Germany: Springer-Verlag, SNOMED CT: nenalezen MeSH: nenalezen ICD10: nenalezen Inference Definice: Inference je způsob indukčního uvažování, které je založeno na informaci získané z výběru, kdy se snažíme o zobecnění této informace na celou populaci, ze které výběr pochází. Synonyma: indukce, usuzování Zdroj: Dodge Y. The Concise Encyclopedia of Statistics. Germany: Springer-Verlag, SNOMED CT: nenalezen MeSH: nenalezen ICD10: nenalezen Reference [1] Boulet SL, Salihu HM, Alexander GR. Mode of delivery and birth outcome of macrosomic infants. J Obstet Gynaecol 2004; 24: [2] Fang S. Management of preterm infants with intrauterine growth restriction. Early Hum Dev 2005; 81: [3] Hall MH, Carr-Hill RA. The significance of uncertain gestation for obstetric outcome. Br J Obstet Gynaecol 1985; 92: [4] Royston P, Sauerbrei W. Multivariable model-building: A pragmatic approach to regression analysis based on fractional polynomials for modelling continuous variables. Chichester, England: John Wiley, [5] Wright EM, Royston P. A comparison of statistical methods for age-related reference intervals. J R Statist Soc A 1997; 160: [6] Silverwood RJ, Cole TJ. Statistical methods for constructing gestational age-related reference intervals and centile charts for fetal size. Ultrasound Obstet Gynecol 2007; 29: [7] Hynek M. Approaches for constructing age-related reference intervals and centile charts for fetal size. Eur J Biomed Informatics 2010; 6: [8] Borghi E, Onis M, Garza C, et. al. Construction of the World Health Organization child growth standards: selection of methods for attained growth curves. Statist Med 2006; 25: [9] Altman DG, Chitty LS. Design and analysis of studies to derive charts of fetal size. Ultrasound Obstet Gynecol 1993; 3: [10] Villar J, Altman DG, Purwar M, et al.; International Fetal and Newborn Growth Consortium for the 21st Century. The objectives, design and implementation of the INTERGROWTH- 21st Project. BJOG 2013; 120 (Suppl 2): [11] Ioannou C, Talbot K, Ohuma E, et al. Systematic review of methodology used in ultrasound studies aimed at creating charts of fetal size. BJOG 2012; 119(12): [12] Altman DG, Ohuma EO; International Fetal and Newborn Growth Consortium for the 21st Century. Statistical considerations for the development of prescriptive fetal and newborn growth standards in the INTERGROWTH-21st Project. BJOG 2013; 120 (Suppl 2): [13] Royston P, Altman DG. Regression using fractional polynomials of continuous covariates: Parsimonious parametric modelling. Appl Statist 1994; 43: [14] Altman DG. Construction of age-related reference centiles using absolute residuals. Statistics in Medicine 1993; 12: [15] Royston P, Wright EM. How to construct normal ranges for fetal variables. Ultrasound Obstet Gynecol 1998; 11: Sémantická interoperabilita v biomedicíně a zdravotnictví
33 Hynek M. a kol. Statistické metody pro tvorbu časově závislých percentilových grafů [16] Aitkin MA. Modelling variance heterogenity in normal regression using GLIM. Applied Statistics 1987; 36: [17] Mosteller F, Tukey J. Data analysis and regression: A second course. New York: Addison-Wesley, [18] Long JD. Longitudinal data analysis for the behavioral sciences using R. Thousand Oaks, Calif.: Sage, [19] Chitty LS, Altman DG. Charts of fetal size: limb bones. BJOG 2002; 109: [20] Papageorghiou AT, Kennedy SH, Salomon LJ, et al.; International Fetal and Newborn Growth Consortium for the 21st Century (INTERGROWTH-21st). International standards for early fetal size and pregnancy dating based on ultrasound measurement of crown-rump length in the first trimester of pregnancy. Ultrasound Obstet Gynecol 2014; 44: [21] Papageorghiou AT, Ohuma EO, Altman DG, et al.; International Fetal and Newborn Growth Consortium for the 21st Century (INTERGROWTH-21st). International standards for fetal growth based on serial ultrasound measurements: the Fetal Growth Longitudinal Study of the INTERGROWTH-21st Project. Lancet 2014; 384(9946): [22] Royston P, Wright EM. Goodness-of-fit statistics for agespecific reference intervals. Stat Med 2000; 19: [23] D Agostino RB, Belanger A, D Agostino Jr RB. A Suggestion for Using Powerful and Informative Tests of Normality. Am Stat 1990; 44: [24] Sasieni P, Royston P, Cox NJ. Symmetric nearest neighbour linear smoothers. Stata J 2005; 5: 285. [25] Friedman JH, Silverman BW. Flexible Parsimonious Smoothing and Additive Modeling. Technometrics 1989; 31(1): [26] Long J, Ryoo Jihoon. Using fractional polynomials to model non-linear trends in longitudinal data. Br J Math Stat Psychol 2010; 63: [27] Fitzmaurice GM, Laird NM, Ware JH. Applied longitudinal analysis. New York: Wiley, [28] Galecki A, Burzykowski T. Linear mixed-effects models using R a step-by-step approach. New York: Springer, [29] Laird N, Ware J. Random-effects models for longitudinal data. Biometrics 1982; 38: [30] Burnham KP, Anderson DR. Model Selection and Multimodel Inference. New York: Springer, [31] Burnham KP, Anderson DR. Multimodel inference: understanding AIC and BIC in model selection. Socio Meth Res 2004; 33(2): [32] Burnham KP, Anderson DR, Huyvaert KP. AIC model selection and multimodel inference in behavioral ecology: some background, observations, and comparisons. Behav Ecol Sociobiol 2011; 65: [33] Paulsen JS, Smith MM, Long JD; PREDICT HD investigators and Coordinators of the Huntington Study Group. Cognitive decline in prodromal Huntington: Disease: implications for clinical trials. J Neurol Neurosurg Psychiatry 2013; 84: [34] Leoni V, Long JD, Mills JA, et al.; PREDICT-HD study group. 24S-hydroxycholesterol correlation with markers of Huntington disease progression. Neurobiol Dis 2013; 55: [35] Burnham KP, Anderson DR. Kullback-Leibler information as a basis for strong inference in ecological studies. Wildl Res 2001; 28: [36] Akaike H. Information theory as an extension of the maximum likelihood principle. In: Petrov BN, Csaki F, editors. Proceedings of the 2nd International Symposium on Information Theory; 1973; Budapest, Hungary: Akademiai Kiado. p [37] Hurvich CM, Tsai CL. Regression and time series model selection in small samples. Biometrika 1989; 76: [38] Liang H, Wu H, Zou G. A note on conditional AIC for linear mixed-effects models. Biometrica 2008; 95: [39] Vaida F, Blanchard S. Conditional Akaike information for mixed-effects model. Biometrica 2005; 92: [40] Link WA, Barker RJ. Model weights and the foundations of multimodel inference. Ecology 2006; 87: [41] Kadane JB, Lazar NA. Methods and criteria for model selection. J Amer Statist Assoc 2004; 99: Sémantická interoperabilita v biomedicíně a zdravotnictví
34 28 Krsička D., Šárek M. Význam deficitu cerebrálního folátu pro vývoj a progresi autismu Význam deficitu cerebrálního folátu pro vývoj a progresi autismu Daniel Krsička 1, Milan Šárek lékařská fakulta, Univerzita Karlova, Praha, Česká republika 2 EuroMISE Mentor Association, Praha, Česká republika Kontakt: Daniel Krsička 1. lékařská fakulta, Univerzita Karlova, Praha Adresa: Kateřinská 32, , Praha, ČR E mail: dkrsicka@gmail.com Cíle výzkumu Naším cílem je lepší porozumění vztahům mezi autismem, resp. poruchou autistického spektra (PAS), a deficitem cerebrálního folátu (CFD), jeho etiologie, patofyziologie a synergických efektů nedostatku folátů v různých kritických okamžicích vývoje jedince a dalších subklinických nox z prostředí nebo genetických predispozic. Některé geny asociované s PAS nebo jinými neurovývojovými poruchami mají metabolickou roli, protože jsou překládány do proteinu s katalytickou aktivitou enzymu. Předpokládáme, že nedostatek folátů může negativně ovlivnit některé metabolické reakce kritické pro rozvoj nebo progresi PAS podobným způsobem jako patologické změny v daných genech dokonce i za podmínek, kdy jsou dané geny intaktní, nebo synergisticky zesilovat význam méně významných genetických patologií. Tedy, že dysregulace v množství substrátů, metabolitů nebo kofaktorů mohou rezultovat v podobnou poruchu jako dysfunkční polymorfismy nebo delece příslušných genů za normálních koncentrací těchto látek. Také by mohlo být zajímavé zkoumat další patologické efekty nedostatku folátů, jako jsou změny v genové expresi na podkladě dysregulace koncentrace folátů, změny ve vývojové signalizaci, změny v methylačních vzorech DNA nebo vztahy k částečné mitochondriální dysfunkci. Naše hypotéza se zakládá na publikované klinické zkušenosti s diagnózou a léčbou konkomitantního CFD u PAS s hlášeným zmírněním nebo dokonce potlačením jaderných symptomů PAS v některých případech. Náš první cíl je deterministicky nalézt vztahy mezi folátovým metabolismem a metabolickými reakcemi asociovanými s autismem v co nejširším možném záběru a určit mezi různými publikovanými biochemickými, fyziologickými a klinickými nálezy ty, které jsou skutečně významné pro rozvoj a progresi PAS. Taková znalost, když bude vytvořena, by mohla být dále rozvíjena v hlubším detailu například stran významu deplece folátů pro přesně definované prenatální nebo postnatální vývojové fáze nebo významu nedostatku folátů k vyšší prevalenci PAS u chlapců a mnoha dalších. Také můžeme testovat, jak se změní exprese genů za podmínek snížené koncentrace folátů, tj. které geny budou více exprimovány a zdali některé z nich, na základě aktuálně dostupných informací, nejsou asociovány s PAS. Seznam možných experimentů je mnohem širší a je také obohacen překryvem s dalšími onemocněními jako je schizofrenie, amnézie nebo trisomie 21, které se jeví také částečně závislé na folátech. Současný stav poznání Etiologie autismu, resp. poruch autistického spektra (PAS), je víceméně neznámá, genetické syndromy připadají pouze na zhruba 15% případů. Etiologie je především multifaktoriální, a z toho důvodu jakýkoli efektivní výzkum musí zkoumat více faktorů. V našem posledním review [1] jsme našli celkem 351 publikovaných případů CFD s různě závažným PAS u 44% pacientů a 56% z těchto případů bylo způsobeno protilátkami folátových receptorů (FRAA), které narušují, nebo dokonce blokují přenos folátů přes hematoencefalickou bariéru. Speciálně se soustředíme na tyto případy PAS, protože běžně je poměrně obtížné a nepravděpodobné diagnostikovat mírný CFD u pacientů s PAS. Jediná dostupná a zcela spolehlivá metoda je lumbální punkce s vyšetřením hladiny 5-MTHF (5-methyltetrahydrofolát) v likvoru, která není, pro svou invazivitu, rutinně indikována u PAS. Méně invazivní metody, jako např. MR spektroskopie, dnes nemají potřebnou rozlišovací schopnost v řádech nmol/l. Vyšetření na FRAA pozitivitu je zatím dostupné jen v několika laboratořích na světě. Proto je možné, že mírný CFD u PAS dlouhodobě uniká pozornosti v diagnostice a léčbě a že může přispívat k rozvoji a progresi PAS. Navíc, 29% nalezených případů PAS s konkomitantním CFD ukazuje, že léčba může zmírnit nebo občas dokonce potlačovat jaderné symptomy PAS [2, 3, 4, 5, 6, 7]. Nemělo by být opomenuto, že existují také jiné experimentální studie léčby PAS, založené na podávání látek, jejichž syntéza nebo koncentrace je přímo či nepřímo závislá na Sémantická interoperabilita v biomedicíně a zdravotnictví
35 Krsička D., Šárek M. Význam deficitu cerebrálního folátu pro vývoj a progresi autismu 29 folátech nebo foláty kontrolovaných reakcích, ve kterých foláty vystupují jako kofaktory [8, 9, 10, 11, 12, 13]. Významně zvýšené hladiny FRAA rezultují v typický degenerativní progredující obraz CFD, nicméně význam mírně zvýšených hladin FRAA, resp. mírně snížených hladin folátů pouze v CNS, zatím není pro patofyziologii PAS dostatečně znám. Abnormality v hladinách folátů mohou pravděpodobně přispívat k mnoha dalším epigenetickým narušením spojovaným s PAS a dalšími neurovývojovými a neurodegenerativními poruchami, jako je abnormální methylace genomu, oxidativní stress, mitochondriální a neuronální poškození nebo abnormální imunitní odpověd. Samotný dlouhodobý nedostatek folátů zřejmě není potřeba, ale působící společně s dalšími faktory jako nevýznamné genetické mutace, subklinická environmentální toxická zátěž, dlouhodobý stres nebo specifické protilátky jako třeba FRAA mohou vysvětlit a způsobovat abnormální růst CNS, neuronální diferenciaci, migraci a pruningu nebo aktivaci apoptózy vedoucí k neurodegeneraci. Ve vztahu k neuronální tkáni není dlouhodobý inzult potřeba. Vliv krátko- nebo střednědobého nedostatku folátů v různých vývojových obdobích jedince nebyly zatím dostatečně studovány. Prevalence mírného CFD u PAS není dostatečně zmapována stejně jako jeho ovlivnění dalších patologických příčin. Byla publikována jen velmi malá část případů (celkem 351). Dokonce i vliv terapie mírného CFD na symptomy PAS není dostatečně dokumentován. Publikované výsledky jasně dokazují potřebu dalšího výzkumu v této oblasti především proto, že PAS je aktuálně považován za neléčitelné celoživotní postižení neznámé etiologie s vysokým socioekonomickým zatížením. U pacientů s PAS a prokázaným CFD byly opakovaně popisována zlepšení neurologických symptomů i jaderných symptomů PAS. Některé publikace také ukazují negativní korelaci mezi věkem pacienta a účinností léčby. Raná intervence se tedy jeví jako zcela zásadní. Aktuální výzkum příčin PAS sestává z 2 hlavních proudů. První zkoumá polygenní vliv mnoha genů a koncentruje se na genom jako takový. Druhý směr výzkumu se zabývá epigenetickými změnami a působením faktorů prostředí. Oba tak představují výzvu z oblasti Big Data jako zpracování velkoobjemových dat z personalizovaných celogenomových sekvenování, porovnávání velkých množin dat, automatizace odvozování nových informací a další. S ohledem na několik posledních výsledků se zdá, že existuje folátově-dependentní fenotyp PAS a že nedostatek folátů také může přispívat k vývoji nebo zhoršení dalších onemocnění jako schizofrenie [14, 15, 16], náhlá amnézie v dospělosti [17] nebo trisomie 21 [18]. Tyto fenotypy mohou sestávat z polygenního vlivu více faktorů, které jsou synergisticky posilovány nedostatkem folátů. Genetická složka se zdá být stále důležitá, nicméně nemůže přesvědčivě vysvětlit všechny případy a výsledky výzkumu. Zdá se, že faktory prostředí formující epigenetické vlivy by měly být vzaty v úvahu. Tyto faktory mohou manifestovat jiným způsobem a nemusí být primárně spojovány s PAS v klinické praxi. Folátově-dependentní fenotyp PAS, pokud bude identifikován, by mohl významně ovlivnit další klinický výzkum léčby PAS podle pravidel medicíny založené na důkazech. Pro efektivní rozlišení fenotypů, screening, včasnou diagnostiku a biologické terapie PAS je nezbytné lépe pochopit synergický efekt působení více faktorů, které společně manifestují jako neurobehaviorální syndrom, ale samostatně každý zvlášt představují jen subklinický nemanifestní problém. Heterogenní příčiny, které mohou působit současně a synergicky posilovat jedna druhou, pokud nejsou zkoumány společně, prakticky znemožňují správně vybrat testovací skupinu do jakékoli studie. Smíšená testovací skupina složená z více vzájemně nerozlišených fenotypů PAS, by ovlivnila výsledek každé studie náhodným způsobem a mezi výsledky studií by byly vždy výrazné rozdíly. Postupně by bylo možné identifikovat pouze dominantní příčiny, jak se tomu zdá být u závažného CFD na podkladě FRAA. Naopak, pokud by bylo možné identifikovat a klasifikovat jednotlivé, samostatně nevýznamné, ale společně manifestní noxy, výrazně by to přispělo k identifikaci nových etiologií PAS. Proto identifikace a klasifikace každého nového fenotypu PAS je pro další vývoj nezbytná. Uplatnění v biomedicíně a zdravotnictví Máme předběžné výsledky, které potvrzují naše hypotézy. Pro tyto výsledky stran vztahů folátů a PAS existují 2 hlavní praktická využití: prevence léčba U PAS jako celoživotního, obecně neléčitelného postižení je rozhodující identifikovat suspektní těhotenství nebo dokonce rodiče co nejdříve. Jestliže existuje vztah mezi nedostatkem folátů a některými poměrně novými noxami jako FRAA ovlivňujícími vyvíjející se plod nebo dítě, musí být identifikován, aby byla možná účinná prevence nebo kompenzace problému předtím, než dojde k rozvoji PAS. Předpokládáme, že lepší a hlubší pochopení vztahů mezi foláty a patofyziologií PAS může odkrýt další genetické, epigenetické a environmentální rizikové faktory, které mohou přispívat k významu mírné deplece folátů, tedy faktory definující folátově-fragilní fenotyp PAS. Tyto informace by mohly být použity k vývoji nových populačních screeningů a celkově vést ke snížení prevalence PAS a jeho socioekonomického zatížení. Neposledním využitím výsledků výzkumu je stále otevřená možnosti využití folátů jako součásti biologické terapie PAS u již rozvinutých případů. Sémantická interoperabilita v biomedicíně a zdravotnictví
36 30 Krsička D., Šárek M. Význam deficitu cerebrálního folátu pro vývoj a progresi autismu Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Autismus Definice: Pervazivní neurovývojová porucha charakterizovaná postižením komunikačních dovedností, dysfunkční sociální interakcí, deficitem představivosti a stereotypním chováním. Synonyma: Porucha autistického spektra, dětský autismus (nepřesné) Zdroj: SNOMED CT: MeSH: F ICD10: nenalezen přesný kód (pouze nepřesný F84.0) Syndrom deficitu cerebrálního folátu Definice: Progresivní neurodegenerativní syndrom, především v raném dětství, charakterizovaný sníženou hladinou folátů v centrálním nervovém systému při současně normálních systémových hladinách. Synonyma: Neurodegenerace na podkladě nedostatku cerebrálních folátů Zdroj: SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: přesný kód nenalezen (pouze nepřesný E53.9) Folát Definice: Jedna z biologicky aktivních forem kyseliny listové vzájemně se odlišujících různou úrovní oxidace/redukce a počtem glutamových zbytků. Synonyma: Kyselina listová, Kyselina Pteroylglutamová, Vitamin B9 Zdroj: SNOMED CT: MeSH: D ICD10: nenalezeno Folátový receptor 1 Definice: Subtyp GPI-připojeného receptoru, který je exprimován v tkáních epiteliálního původu, klinicky významný v oblasti plexus choroideus kvůli 3- násobné koncentraci folátů v cerebrospinálním prostoru ve srovnání s hladinou v krvi. Synonyma: FOLR1 receptor Zdroj: receptor_1 SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Protilátka folátových receptorů Definice: Protilátka typu IgM nebo IgG proti proteinu FOLR1 narušující nebo blokující vysokoafinitní nízkokoncentrační receptor FOLR1 významně exprimovaný na hematoencefalické bariéře. Synonyma: FOLR1 protilátka Zdroj: SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Reference [1] D. Krsička, M. Vlčková, and M. Havlovicová, The Significance of Cerebral Folate Deficiency for the Development and Treatment of Autism Spectrum Disorders, Int. J. Biomed. Healthc., vol. 1, no. 1, [2] V. T. Ramaekers, S. P. Rothenberg, J. M. Sequeira, T. Opladen, N. Blau, E. V Quadros, and J. Selhub, Autoantibodies to folate receptors in the cerebral folate deficiency syndrome., N. Engl. J. Med., vol. 352, no. 19, pp , May [3] V. T. Ramaekers, J. M. Sequeira, N. Blau, and E. V Quadros, A milk-free diet downregulates folate receptor autoimmunity in cerebral folate deficiency syndrome., Dev. Med. Child Neurol., vol. 50, no. 5, pp , May [4] P. Moretti, S. U. Peters, D. Del Gaudio, T. Sahoo, K. Hyland, T. Bottiglieri, R. J. Hopkin, E. Peach, S. H. Min, D. Goldman, B. Roa, C. a Bacino, and F. Scaglia, Brief report: autistic symptoms, developmental regression, mental retardation, epilepsy, and dyskinesias in CNS folate deficiency., J. Autism Dev. Disord., vol. 38, no. 6, pp , Jul [5] S. U. Steele, S. M. Cheah, A. Veerapandiyan, W. Gallentine, E. C. Smith, and M. A. Mikati, Electroencephalographic and seizure manifestations in two patients with folate receptor autoimmune antibody-mediated primary cerebral folate deficiency., Epilepsy Behav., vol. 24, no. 4, pp , Aug [6] R. E. Frye, J. M. Sequeira, E. V Quadros, S. J. James, and D. A. Rossignol, Cerebral folate receptor autoantibodies in autism spectrum disorder., Mol. Psychiatry, vol. 18, no. 3, pp , Mar Sémantická interoperabilita v biomedicíně a zdravotnictví
37 Krsička D., Šárek M. Význam deficitu cerebrálního folátu pro vývoj a progresi autismu 31 [7] R. S. Al-Baradie and M. W. Chaudhary, Diagnosis and management of cerebral folate deficiency. A form of folinic acidresponsive seizures., Neurosciences (Riyadh)., vol. 19, no. 4, pp , Oct [8] D. A. Rossignol and R. E. Frye, Melatonin in autism spectrum disorders: a systematic review and meta-analysis., Dev. Med. Child Neurol., vol. 53, no. 9, pp , Sep [9] R. Coben, M. Linden, and T. E. Myers, Neurofeedback for autistic spectrum disorder: a review of the literature., Appl. Psychophysiol. Biofeedback, vol. 35, no. 1, pp , [10] K. Bertoglio, S. Jill James, L. Deprey, N. Brule, and R. L. Hendren, Pilot study of the effect of methyl B12 treatment on behavioral and biomarker measures in children with autism., J. Altern. Complement. Med., vol. 16, no. 5, pp , May [11] R. E. Frye, D. Rossignol, M. F. Casanova, G. L. Brown, V. Martin, S. Edelson, R. Coben, J. Lewine, J. C. Slattery, C. Lau, P. Hardy, S. H. Fatemi, T. D. Folsom, D. Macfabe, and J. B. Adams, A Review of Traditional and Novel Treatments for Seizures in Autism Spectrum Disorder: Findings from a Systematic Review and Expert Panel., Front. public Heal., vol. 1, p. 31, [12] E. A. Langley, M. Krykbaeva, J. K. Blusztajn, and T. J. Mellott, High maternal choline consumption during pregnancy and nursing alleviates deficits in social interaction and improves anxiety-like behaviors in the BTBR T+Itpr3tf/J mouse model of autism., Behav. Brain Res., Oct [13] K. Williams, A. Brignell, M. Randall, N. Silove, and P. Hazell, Selective serotonin reuptake inhibitors (SSRIs) for autism spectrum disorders (ASD)., Cochrane database Syst. Rev., vol. 8, p. CD004677, Jan [14] V. T. Ramaekers, B. Thöny, J. M. Sequeira, M. Ansseau, P. Philippe, F. Boemer, V. Bours, and E. V Quadros, Folinic acid treatment for schizophrenia associated with folate receptor autoantibodies., Mol. Genet. Metab., Oct [15] A. Ho, D. Michelson, G. Aaen, and S. Ashwal, Cerebral folate deficiency presenting as adolescent catatonic schizophrenia: a case report., J. Child Neurol., vol. 25, no. 7, pp , [16] Q. Wang, J. Liu, Y.-P. Liu, X.-Y. Li, Y.-Y. Ma, T.-F. Wu, Y. Ding, J.-Q. Song, Y.-J. Wang, and Y.-L. Yang, [Methylenetetrahydrofolate reductase deficiency-induced schizophrenia in a school-age boy]., Zhongguo Dang Dai Er Ke Za Zhi, vol. 16, no. 1, pp. 62 6, Jan [17] Z. Sadighi, I. J. Butler, and M. K. Koenig, Adult-onset cerebral folate deficiency., Arch. Neurol., vol. 69, no. 6, pp , [18] H. Blehaut, C. Mircher, A. Ravel, M. Conte, V. de Portzamparc, G. Poret, F. H. de Kermadec, M.-O. Rethore, and F. G. Sturtz, Effect of leucovorin (folinic acid) on the developmental quotient of children with Down s syndrome (trisomy 21) and influence of thyroid status., PLoS One, vol. 5, no. 1, p. e8394, Jan Sémantická interoperabilita v biomedicíně a zdravotnictví
38 32 Mužný M. et al. Integrace zařízení pro léčbu diabetu a lifestyle zařízení v rámci mobilní aplikace... Integrace zařízení pro léčbu diabetu a lifestyle zařízení v rámci mobilní aplikace pro self-management diabetu Miroslav Mužný 1,2, Martina Vlasáková 1, Jan Mužík 1,2, Eirik Arsand lékařská fakulta, Univerzita Karlova v Praze, Česká republika 2 Fakulta biomedicínského inženýrství, ČVUT v Praze, Česká republika 3 Norské centrum pro integrovanou péči a telemedicínu, Tromso, Norsko Kontakt: Miroslav Mužný Centrum podpory aplikačních výstupů a spin-off firem, 1. lékařská fakulta, Univerzita Karlova v Praze Adresa: Studničkova 7, Praha 2 E mail: mmuzny@gmail.com Cíle výzkumu Lidé trpící onemocněním diabetes mellitus mají možnost lépe zvládat jeho průběh používáním různých zařízení, která jim pomáhají lépe porozumět souvislostem, v jakých reaguje jejich tělo. Toto je značně usnadněno dostupností moderních chytrých telefonů a digitálních diabetických deníků, které fungují jako agregátor a interpret sesbíraných dat. Důležitou roli v tomto adaptačním procesu hrají nositelná zařízení, která integrují několik typů senzorů a mohou tak efektivně spojit funkcionalitu několika zařízení. Integrace z několika datových zdrojů nicméně přináší určité riziko zneužití dat. Zapracování dat do digitálního deníku diabetika musí být proto zajištěno tak, aby nehrozila kompromitace funkcí daného zařízení a jejich používání neohrozilo samotného uživatele [1]. Jaký typ dat může být zajímavý pro uživatele digitálního deníku diabetika? Příkladem jsou data o fyzické aktivitě, nutriční data, data o tepové frekvenci, váze a data z inzulínových pump a kontinuálních glukometrů. Tato data mohou být sbíraná pomocí snímačů fyzické aktivity, chytrých hodinek, vah a pomocí closed-loop systémů. Každé ze zařízení, které je zaintegrováno do digitálního deníku diabetika, může poskytnout nový pohled na self-management diabetu pacienta. Vzhledem k absenci bezpečného, otevřeného komunikačního rozhraní je nutné pečlivě zvážit rizika plynoucí pro jejich uživatele. V rámci našeho výzkumu zkoumáme možnosti integrace podobných zařízení do mobilní aplikace Diabetesdagboka [2]. Současný stav poznání Jedním z nejvíce diskutovaných omezení pro uživatele využívající zařízení pro léčbu diabetu, je nemožnost mít kontrolu nad vlastními daty. V poslední době výrobci těchto zařízení umožňují nahrávat nasbíraná data na vzdálený server, který slouží pro potřeby zálohy a zároveň jako prostředek pro vzdálenou synchronizaci s více zařízeními. Mají však uživatelé zájem o to, aby jejich zdravotní data byla na vzdálených serverech? Výrobci lifestyle zařízení a zařízení pro léčbu diabetu obecně neposkytují prostředky které by umožnily jejich bezpečnou integraci do aplikací třetích stran pomocí přímé komunikace s daným zařízením a omezují tak jejich uživatele k použití proprietárního software. Ačkoliv jsou některá zařízení pro tento účel uzpůsobena, pro většinu z nich je přímé komunikační rozhraní nedostupné. Uplatnění v biomedicíně a zdravotnictví V posledních měsících lze pozorovat důležitost komunit, které se zabývají vytvářením alternativního softwaru pro zařízení na trhu. Jedním z nich je komunita Nightscout, jejíž členové se na internetu identifikují pomocí tagu #WeAreNotWaiting. Lidé v rámci této komunity vyvinuli mobilní aplikaci pro kontinuální glukometry Dexcom, kterou je možné vyčítat data pomocí běžně dostupného vybavení (USB OTG kabelu). Kontinuální glukometr je pak možné využít například pro vzdálené sledování stavu glykémie dítěte. Dalším příkladem je Diabeto, startup projekt který si klade za cíl vyvinout zařízení sloužící pro jednodušší integraci glukometrů v rámci mobilní aplikace. Toto zařízení bude možné připojit do jack konektoru glukometru a pomocí něj bezdrátově vyčítat naměřené glykemické hodnoty do chytrého telefonu. Podobný přístup by značně usnadnil použití několika různých glukometrů a jejich bezpečnou integraci do mobilního diabetického deníku. Sémantická interoperabilita v biomedicíně a zdravotnictví
39 Mužný M. et al. Integrace zařízení pro léčbu diabetu a lifestyle zařízení v rámci mobilní aplikace Díky výše popsaným snahám komunitního vývoje je možné podstatně snadněji integrovat zařízení do digitálního diabetického deníku. Přestože tyto modifikace a úpravy nejsou oficiálně podporovány výrobci zařízení pro léčbu diabetu a jejich použití vyžaduje technické znalosti, ukazují nové možnosti, jak využít tato zařízení v různých scénářích běžného života pro lepší léčbu diabetu. Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Nositelná technika Definice: Části oblečení a příslušenství, které integruje prostředky výpočetní techniky. Synonyma: Wearables, Tech togs, Nositelné zařízení Zdroj: technology SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Closed-loop systém Definice: Systém pro automatické dávkování inzulínu, který je složen ze tří komponent: podkožního senzoru pro sledování glykémie, algoritmu pro výpočet dávkování inzulínu a intraperitonealní inzulínové infuzní pumpy. Synonyma: Umělá slinivka Zdroj: Renard, Eric, et al. Closed-loop insulin delivery using a subcutaneous glucose sensor and intraperitoneal insulin delivery feasibility study testing a new model for the artificial pancreas. Diabetes Care 33.1 (2010): SNOMED CT: MeSH: nenalezeno ICD10: nenalezeno Inzuĺınová pumpa Definice: Systém pro dávkování inzulínu. Zahrnuje systém pro regulaci v otevřené smyčce, který může být kontrolován pacientem či předdefinovaným programem a je navržen pro neustálé dávkování malých dávek inzulínu, které jsou zvýšené v průběhu trávení. Zároveň zahrnuje systém pro regulaci v uzavřené smyčce, který dávkuje inzulín automaticky na základě dat ze senzoru pro sledování glykémie. Synonyma: Inzulínový infuzní systém Zdroj: National Library of Medicine SNOMED CT: MeSH: D ICD10: nenalezeno Snímač fyzické aktivity Definice: Nositelný senzor sloužící k odhadu fyzické aktivity. Synonyma: Senzor fyzické aktivity Zdroj: Yang, Che-Chang, and Yeh-Liang Hsu. A review of accelerometry-based wearable motion detectors for physical activity monitoring. Sensors 10.8 (2010): SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Vzdálený dohled pacientů Definice: Komunikační sít pro poskytování údajů o zdravotním stavu pacienta ze vzdáleného místa. Synonyma: Vzdálený dohled Zdroj: Rosenfeld, Brian, and Michael Breslow. Telecommunications network for remote patient monitoring. U.S. Patent No. 7,256, Aug SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Reference [1] KLONOFF, David C. Cybersecurity for Connected Diabetes Devices. Journal of diabetes science and technology, 2015, [2] ARSAND, Eirik, SKROVSETH, Stein Olav, JOAKIMSEN, Ragnar Martin, HARTVIGSEN, Gunnar. Design of an Advanced Mobile Diabetes Diary Based on a Prospective 6-month Study Involving People with Type 1 Diabetes. The 6th International Conference on Advanced Technologies and Treatments for Diabetes, February March , Paris. France. [3] Misfit Scientific Library. Available from: [4] The Nightscout Project. Available from: [5] Diabeto. Available from: Sémantická interoperabilita v biomedicíně a zdravotnictví
40 34 Rak D., Svátek V. Porovnávání WS a lékařských DP s využitím databází řízených medicínských slovníků Porovnávání internetových stránek a lékařských doporučených postupů s využitím databází řízených medicínských slovníků Dušan Rak 1, Vojtěch Svátek lékařská fakulta, Univerzita Karlova v Praze, Praha, Česká republika 2 Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze, Praha, Česká republika Kontakt: Dušan Rak Adresa: U Zátiší 545/9, 14700, Praha 4 E mail: dusan.rak@seznam.cz Cíle výzkumu Probíhající výzkum má za cíl předložit a otestovat jednoduchý postup hodnocení kvality obsahu webových stránek (WS) s využitím doporučených postupů (DP) jako standardu kvality. Řízené medicínské slovníky zde slouží jako prostředek, pomocí kterého jsou obě skupiny dokumentů porovnávány. Z obou skupin porovnávaných dokumentů (WS a DP) jsou extrahovány množiny použitých odborných termínů, které jsou dohledávány právě v řízených medicínských slovnících, jako je UMLS nebo MeSH. Kvalita WS je stanovována jednak na základě obecnější shody obsahu (tedy vyskytujících se konceptů a témat) a dále na základě podobnosti konkrétní použité odborné terminologie s koncepty a terminologií vyskytující se v DP. Dílčím cílem je navrhnout a vyhodnotit vhodné metody agregace terminologie DP tak, aby bylo možno testované WS porovnávat vůči jedinému měřítku i v případě, že je dostupných DP více. Důležitým cílem práce je vyhodnocení použitelnosti tohoto postupu v procesu poloautomatického hodnocení kvality. Současný stav poznání Moderní technologie poskytují řadu možností jak publikovat na internetu komukoli téměř cokoli. To se týká i medicínských informací, kde se široká dostupnost mnoha informací s takto závažným obsahem ve velmi variabilní kvalitě, stává velkým problémem. Specializované organizace zabývající se hodnocením kvality webových stránek s medicínskou problematikou a jejich certifikací (např. HON [1]), které dříve hodnotily webové stránky ruční recenzí, vyvíjejí nástroje na automatizaci nebo alespoň poloautomatizaci vyhodnocování kritérií kvality. Automatizace je ovšem v převážné většině zatím omezena pouze na hodnocení formálních aspektů kvality prezentací a jediná reálná možnost, jak ověřit kvalitu obsahu medicínských textů, zůstává verifikace odborníkem v oboru. Doporučené postupy (DP) v lékařství jsou systematicky vytvářeny a publikovány renomovanými lékařskými společnostmi na základě výsledků medicíny založené na důkazech (MZD) [2]. Tyto texty jsou následně publikovány veřejně v strukturované textové podobě určené pro využití odbornou veřejností. DP jsou navíc také dostupné ve vysoce formalizované podobě například ve formátu GLIF [3]. Cílem této formalizace je usnadnit následné využití informací obsažených v DP automatizovanými informatickými postupy. Uplatnění v biomedicíně a zdravotnictví DP pro jednotlivé oblasti medicíny poskytují cenný standard kvality využitelný odbornou lekařskou veřejností a také certifikačními autoritami pro ruční hodnocení kvality obsahu webových stránek. I přes vysokou formalizaci DP je ale jejich využití pro plné, zcela automatizované hodnocení kvality obsahu zatím nemyslitelné. Předpokládalo by totiž velmi pokročilé strojové porozumění textu. Na druhou stranu námi testované relativně přímočaré porovnání podobnosti množin nalezených odborných termínů (do určité míry jistě reprezentujících obsah), mezi DP a hodnocenými WS, může být realisticky automatizovatelným, ale současně velmi cenným a vypovídajícím měřítkem kvality. S jeho pomocí lze získat představu například o úplnosti textu, kvalitě a odbornosti použité terminologie, případně WS klasifikovat do skupin podobnosti. Vedle těchto kvantitativních kritérií je možno lidským expertům, zabývajícím se hodnocením a certifikací WS, poskytnout jako přidanou hodnotu taktéž vlastní texty WS anotované odbornou terminologií. Sémantická interoperabilita v biomedicíně a zdravotnictví
41 Rak D., Svátek V. Porovnávání WS a lékařských DP s využitím databází řízených medicínských slovníků 35 Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Anotace Definice: Anotací rozumíme opatření zdrojových dat (textu, videa, obrazu atd.) popisnými nebo klasifikačními záznamy. Například jde o přidání různých poznámek, značek nebo obecně jakýchkoli metainformací k dokumentu jako celku nebo přímo k jeho částem. Synonyma: Lingvistická anotace (ve zpracování textu), Tagování Zdroj: kombinovaná definice z více zdrojů SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Koncept Definice: Koncept je základní jednotkou významu někdy je považován za základní složku znalostí. Každý koncept se skládá z dalších částí, které jsou jeho vlastnostmi. Koncept tedy není jen definicí, ale spíše označením pro skupinu vlastností něčeho, co představuje. Synonyma: Pojem (v kognitivní vědě) Zdroj: přeloženo a upraveno z wikipedia.org/wiki/concept a thefreedictionary.com/concept SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Medicína založená na důkazech (MZD) Definice: MZD vědomě, cíleně a explicitně využívá aktuální nejlepší a nejsilnější vědecké důkazy pro rozhodování o zdravotní péči pro konkrétní pacienty. Praxe MZD integruje expertní znalosti lékaře s nejlepšími dostupnými důkazy výzkumu. Zohledňována je síla důkazů o rizicích a přínosech jednotlivých léčebných postupů (včetně neléčení) o diagnostických testech atd. Synonyma: Praxe založená na důkazech (významově širší pojem) Zdroj: Sackett DL. Evidence based medicine: what it is and what it isn t. BMJ 1996;312:7 SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Podobnost Definice: Koncept umožňující přiřadit skupině dokumentů nebo skupině seznamů termínů hodnotu ukazující vzájemnou blízkost či shodu jejich sémantiky. Synonyma: Sémantická / obsahová podobnost či blízkost Zdroj: přeloženo ze stránky org/wiki/semantic_similarity SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno UMLS Definice: Kompendium mnoha řízených biomedicínských slovníků. Původně bylo vytvořeno v roce 1986 v NLM (americkou Národní lékařskou knihovnou). Účelem UMLS je usnadnění vývoje výpočetních systémů, které se chovají jako by rozuměly významu přirozeného jazyka v biomedicíně a zdravotnictví. S tím cílem NLM vytváří a distribuuje UMLS Knowledge sources (znalostní zdroje ve formě databází) a asociované softwarové nástroje pro využití vývojáři. Existují tři UMLS Knowledge Sources : the Metathesaurus (metatezaurus), the Semantic Network (sémantická sít ) a SPECIALIST Lexicon. Zdroj: NML On-Line SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Reference [1] Health On the Net Foundation [Internet]. Available from: [2] Sackett DL. Evidence based medicine: what it is and what it isn t. BMJ 1996;312:7 [3] Ohno-Machado L, et al. The GuideLine Interchange Format: A Model for Representing Guidelines. J Am Med Inform Assoc Jul-Aug; 5(4): Sémantická interoperabilita v biomedicíně a zdravotnictví
42 36 Seidl L., Hanzĺıček P. Mezinárodní komunikační standardy a interoperabilita systémů v českém zdravotnictví Mezinárodní komunikační standardy a interoperabilita systémů v českém zdravotnictví Libor Seidl 1, Petr Hanzĺıček lékařská fakulta, Univerzita Karlova v Praze, Praha, Česká republika 2 ČD Cargo, Praha, Česká republika Kontakt: Libor Seidl Centrum pro ehealth a telemedicínu Adresa: Studničkova 7, Praha 2, E mail: Libor.Seidl@lf1.cuni.cz Cíle výzkumu Cílem výzkumu je identifikace možností a posouzení překážek při aplikaci mezinárodních komunikačních protokolů do českého prostředí. České zdravotnictví se na poli interoperability informačních systémů opírá zejména o český datový standard DASTA [1]. Tento protokol vzniká od roku 1997 dle aktuálních potřeb jednotlivých výrobců nemocničních informačních systémů na realizaci přenosu dat. Při zběžném pohledu na specifikaci DASTA zcela chybí definice spouštěcích událostí (kdy se datový obsah komunikuje), význam přenášených dat (nový záznam/smazání záznamu), definice zodpovědností aplikačních rolí odesílatele a příjemce a není uvedena ani následná kaskáda dalších interakcí. Spíše než o zprávově orientovaný komunikační protokol se tedy jedná o standardizovanou datovou strukturu pro zdravotnictví, která se pravděpodobně používá obdobně jako dokument. Mezinárodní standardy naproti tomu nabízejí na zprávách založené komunikační protokoly (HL7 verze 2, HL7 verze 3) i definice dokumentů (Clinical Document Architecture CDA, Continuity of Care Record CCR a EN 13606). Vzhledem k rozšířenosti implementací protokolu DASTA v českém zdravotnictví lze očekávat, že při postupném uplatnění mezinárodních standardů bude nutné alespoň po přechodnou dobu provádět transformaci datových toků mezi všemi datovými protokoly. V tomto procesu změny se budou průběžně měnit komunikační scénáře, což vyžaduje vysokou flexibilitu v konfiguraci meziprotokolové brány. Tato brána tedy nemůže být realizována jako relativně jednoduchá jednoúčelová transformace, nebot neustálé změny a testování implementace by byly nákladné a časová náročnost upgrade by mohla brzdit celkový změnový proces ve zdravotnictví. Východiskem se jeví automaticky konfigurovaná brána, která využívá formalizované znalosti jak o integračním prostředí, o protokolech, tak o komunikované klinické doméně. Ontologické popisy datových komunikačních protokolů a jejich vzájemné mapování umožní objektivní posouzení protokolu DASTA k dalším mezinárodním standardům. Dále bude možné posoudit praktičnost použití a identifikovat překážky při aplikaci mezinárodních komunikačních protokolů do českého prostředí. Současný stav poznání Způsob popisu architektury systému popisuje norma ISO/IEC/IEEE z roku 2011, která nahradila původní normu IEEE 1471:2000. V této normě je také uveden konceptuální model, který zasazuje systém do jeho okolí každý systém existuje v nějakém okolí a naplňuje nějaký účel, ze kterého profitují uživatelé (stakeholdeři). Generický komponentní model (GCM)[2] popisuje architekturu obecného informačního systému rozdělením popisu na doménovou perspektivu, perspektivu architektury systému a perspektivu vývoje a implementace software. Oddělené popisy sousedících částí GCM krychle jsou následně provazovány transformačními mechanizmy. Ontologickou reprezentaci komunikačních protokolů HL7 verze 2 a HL7 verze 3 poprvé navrhl Frank Oemig ve své disertační práci [3]. Pro analýzu a popis dílčích částí problému použil právě architekturní přístup podle GCM. Pro popis struktury vlastních protokolů použil Frank Oemig vyšší ontologii CSO (Communication Standards Ontology)[4] a automaticky generované definice zpráv v OWL z databázového popisu HL7 v2 a z MIF souborů popisujících zprávy HL7 v3. Pro popis domény (administrativní popis pacienta) byla použita referenční ontologie ACGT (Advanced Clinico-Genomic Trial Ontology). Celkové schéma sestavení ontologií je zobrazeno na obrázku 1. Sémantická interoperabilita v biomedicíně a zdravotnictví
43 Seidl L., Hanzĺıček P. Mezinárodní komunikační standardy a interoperabilita systémů v českém zdravotnictví 37 Obrázek 1: Sestavení ontologií, převzato z [3]. Uplatnění v biomedicíně a zdravotnictví Výzkum by měl identifikovat vhodné existující ontologie, doplnit je, případně vytvořit doplňující ontologie, aby vznikl ucelený popis integračního prostředí, klinické domény i komunikačních protokolů. Výzkum by také měl ukázat cestu, jak odlišné ontologie jednotlivých částí GCM propojovat v jediný funkční popis reálného prostředí. Tento ucelený popis bude využit pro automatickou konfiguraci gateway i zhodnocení zralosti protokolů, vhodnosti pro dané integrační prostředí a identifikaci překážek pro použití mezinárodních standardů v českém prostředí. Aplikovaným výstupem výzkumu by mohla být i technologická demonstrace automaticky konfigurovatelné mezi-protokolové brány pro vybraný případ. Kombinace formalizované znalosti a interpretu této formalizace může ukázat budoucí způsob tvorby komplexních informačních systémů. Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Komunikační protokol Definice: Aplikační protokol pro elektronickou výměnu dat v prostředí zdravotnictví. Synonyma: Komunikační standard Zdroj: term_id=1161&searchexp=communication% 20protocol SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno DASTA Definice: DASTA je pravidelně aktualizovaný, otevřený standard pro komunikaci mezi informačními systémy zdravotnických zařízení, který pokrývá oblasti klinické, laboratorní, statistické i administrativní a jehož samozřejmou součástí jsou číselníky (například Národní číselník laboratorních položek, číselník klinických událostí, aktuální číselníky ÚZIS, atd.), dokumenty a nástroje (například program ČLP). Synonyma: Datový standard Zdroj: Sémantická interoperabilita v biomedicíně a zdravotnictví
44 38 Seidl L., Hanzĺıček P. Mezinárodní komunikační standardy a interoperabilita systémů v českém zdravotnictví SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Ontologie Definice: Uspořádání konceptů, pro které lze vytvořit racionální argumenty. Zdroj: term_id=1319&searchexp=ontology SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Doména Definice: Vymezená oblast zájmu nebo specializace. Zdroj: term_id=1154&searchexp=domain SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Brána Definice: Entita, která v reálném čase zabezpečuje obousměrnou komunikaci mezi koncovými stanicemi. Synonyma: Gateway (přejaté slovo z angl.) Zdroj: term_id=1006&searchexp=gateway SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Reference [1] Kolektiv autorů DASTA. Vývoj DASTA Základní informace DASTA [Internet]. [citován 5. duben 2014]. Dostupné z: [2] Blobel B. Application of the Component Paradigm for Analysis and Design of Advanced Health System Architectures. International Journal of Medical Informatics. 18. červenec 2000;60: [3] Oemig F. PhD Thesis: Entwicklung einer ontologiebasierten Architektur zur Sicherung semantischer Interoperabilität zwischen Kommunikationsstandards im Gesundheitswesen [Internet]. [citováno 26. červenec 2012]. Dostupné z: [4] Oemig F, Blobel B. A Communication Standards Ontology Using Basic Formal Ontologies. Studies in Health Technology and Informatics s Sémantická interoperabilita v biomedicíně a zdravotnictví
45 Schlenker A., Reimer M. Velká data v nemocničních informačních systémech z pohledu bezpečnosti 39 Velká data v nemocničních informačních systémech z pohledu bezpečnosti Anna Schlenker 1,2, Michal Reimer 2 1 Ústav hygieny a epidemiologie 1.LF a VFN, 1. lékařská fakulta, Univerzita Karlova v Praze, Česká republika 2 Katedra biomedicínské informatiky, Fakulta biomedicínského inženýrství, České vysoké učení technické v Praze, Kladno, Česká republika Kontakt: Anna Schlenker Ústav hygieny a epidemiologie 1.LF a VFN, Univerzita Karlova v Praze, Česká republika Adresa: Studničkova 7, Praha 2 E mail: schlenker.anna@gmail.com Cíle výzkumu V oblasti zdravotnictví bylo v průběhu let nahromaděné velké množství dat. V dnešní době je pořád většina pacientské dokumentace v papírové podobě. Postupně se však přechází k dokumentaci elektronické a dochází tak i ke konverzi papírové formy do elektronické podoby. Zde se ovšem dostáváme ke zpracovávání velkého objemu dat z elektronických zdravotních záznamů, kterých neustále přibývá [1]. Velká data můžeme definovat pomocí definice 4V [2]: 1. V = volume (objem) znamená, že se objem dat exponenciálně zvyšuje; 2. V = velocity (rychlost) znamená, že je na některých pracovištích potřeba rychle zpracovávat velké množství dat, která neustále vznikají. 3. V = variety (proměnlivost) znamená, že se kromě strukturovaných dat zpracovává také nestrukturovaný text a nebo různé typy multimediálních dat. 4. V = veracity (pravdivost); znamená, že data nemají přesně určenou míru pravdivosti kvůli jejich nekonzistenci, nekompletnosti a mnohokrát i dvojvýznamovosti. Následná analýza nasbíraných velkých dat může také zlepšit kvalitu zdravotní péče. Může pomoct při podpoře rozhodování, při analýze rizik či při nákladové analýze ve zdravotnictví. Další možností je použití při vývoji lékařských doporučení [1]. Statistická analýza může také pomoct s lepší interpretací dat shromážděných v nemocničních informačních systémech [3]. Současný stav poznání Téma bezpečnosti je v oblasti nemocničních informačních systémů velmi aktuální. Je dobře, že jsou současné ordinace bez počítače a bez informačního systému v něm již vzácností. Na stranu druhou se však hodně lidí začíná zajímat o to, kdo má přístup do těchto informačních systémů a k informacím v nich uloženým [4]. V současné době klademe velký důraz na to, že každý uživatel informačního systému musí mít své vlastní přihlašovací údaje. Další důležitou věcí je nastavení rozdílných práv v systému pro různé uživatele (lékař, zdravotní sestra, laborant, radiolog, technický pracovník atd.). Pro uživatele nemocničních informačních systémů se pořádají školení, kde se zdravotničtí pracovníci seznamují s potřebou multifaktorového zabezpečení citlivých pacientských dat [4]. Hlavním důvodem je to, aby si personál v nemocnicích uvědomil, že zadání hesla do informačního systému není pouze něco, co ho zdržuje od práce, ale také něco, co ho může ochránit. Dále pak naučit uživatele, že nemocniční informační systém není pouze obtěžující software, který jim neumožní pokračovat v práci bez vyplnění některých polí, ale ukázat jim, že tyto položky můžou být důležité, a proto bez jejich vyplnění nelze záznam uložit [4]. Současný stav bezpečnosti v nemocničních informačních systémech V dnešní době již většina nemocničních informačních systémů pamatuje na bezpečnost a nabízí možnost nastavení různých práv pro různé uživatele. Bohužel však většina informačních systémů ověřuje uživatele pouze jednou autentizační metodou, typicky heslem. Toto heslo navíc nemusí splňovat požadavky potřebné například pro odolnost proti slovníkovým Sémantická interoperabilita v biomedicíně a zdravotnictví
46 40 Schlenker A., Reimer M. Velká data v nemocničních informačních systémech z pohledu bezpečnosti útokům. Sami uživatelé by proto měli pamatovat na to, že by jako heslo neměli používat jména svých partnerů, dětí, domácích mazlíčků či jiná plnovýznamová slova. Obecně by heslo mělo být dostatečně dlouhé (nejméně 8 znaků), mělo by obsahovat velká i malá písmena, číslice a speciální znaky. Za bezpečné heslo se považuje heslo, které uživatel nikomu nesdělí (ani manželovi či manželce) a nikam si nezapíše. Pro útočníky není nic jednoduššího než opsat heslo, které má uživatel zapsané v diáři či na papírku nalepeném na monitoru [4]. Další chybou většiny nemocničních informačních systémů je, že nepoužívají automatické odhlašování uživatelů. Důvodem je pravděpodobně ztráta času pro zdravotnický personál, který se musí neustále do systému přihlašovat. Na druhou stranu by si ale uživatelé nemocničních informačních systémů měli uvědomit, že opuštění počítače s přihlášeným informačním systémem může způsobit ztrátu či změnu citlivých pacientských dat uložených v daném systému [4]. Uplatnění v biomedicíně a zdravotnictví Pro zlepšení zabezpečení v oblasti nemocničních informačních systémů jsme navrhli aplikaci, která používá multifaktorovou autentizaci, která kombinuje znalostní faktor a biometrický faktor. Jako biometrický faktor jsme použili behaviorální biometrickou charakteristiku nazvanou dynamika stisku počítačových kláves. Dynamika stisku počítačových kláves přesně popisuje styl psaní daného uživatele na klávesnici, a to díky snímání časů, kdy byla konkrétní klávesa stlačena a kdy uvolněna. Aplikaci lze použít následujícími dvěma způsoby: 1. Jako aplikaci pro statické ověřování uživatelů (zadání přihlašovacího jména + hesla + snímání dynamiky stisku počítačových kláves při psaní uživatelského jména a hesla). 2. Jako aplikaci pro kontinuální ověřování identity uživatelů (ověřování, zda uživatel, který pracuje s informačním systémem, je uživatel, který je do systému přihlášený). Největší výhodou této aplikace je sběr dat přímo z operačního systému, tj. bez zpoždění. Aplikace zaznamenává kód dané klávesy, název této klávesy a časy, kdy byla klávesa stlačena a kdy uvolněna. Naše aplikace umožňuje také automatickou analýzu snímaných dat. Pro účely této analýzy aplikace sama počítá časový vektor, který se skládá z dob trvání stisku jednotlivých kláves a z dob mezi jednotlivými stisky (viz Obrázek 1). Obrázek 1: Doba trvání stisku klávesy a doba mezi jednotlivými stisky. Pro lepší a přehlednější zpracování dat jsme aplikaci rozšířili o druhý listview (viz Obrázek 2), kde máme možnost zobrazení druhého záznamu. Aplikace disponuje také postranním panelem (viz Obrázek 2), kde se po označení konkrétních řádků v obou záznamech automaticky vypočítají parametry dynamiky stisku počítačových kláves pro jednotlivé uživatele. Aplikace umožňuje taktéž načtení dříve nasnímaných a uložených záznamů a dává nám tím možnost i zpětné analýzy [5]. Obrázek 2: Konečná verze aplikace pro snímání dynamiky stisku počítačových kláves. Aplikace byla implementována v jazyce C za pomocí Microsoft Visual Studio Express Nasnímaná data se ukládají do souboru CSV. Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Velká data Definice: Velká data lze definovat pomocí tzv. 4V definice, kde V znamená objem (volume), rychlost (velocity), rozmanitost (variabilitu) a pravdivost (veracity). Zdroj: [1] Sémantická interoperabilita v biomedicíně a zdravotnictví
47 Schlenker A., Reimer M. Velká data v nemocničních informačních systémech z pohledu bezpečnosti 41 SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Informační systém Definice: Integrovaná sada souborů, postupů, a zařízení pro skladování, manipulaci a vyhledávání informací. Zdroj: cgi?mode=&term=information+systems &field= entry#treel SNOMED CT: MeSH: D ICD10: nenalezeno Nemocniční informační systém Definice: Integrovaný, počítačem podporovaný systém určený k ukládání, manipulaci a získávání informací týkajících se administrativních a klinických hledisek poskytovaných zdravotnických služeb v rámci nemocnice. Synonyma: NIS Zdroj: MB_cgi?mode=&term=Hospital+Information +Systems&field=entry#TreeL SNOMED CT: MeSH: D ICD10: nenalezeno Multifaktorová autentizace Definice: Bezpečnostní systém, v němž se používá více než jedna forma autentizace k ověření oprávněnosti operace. Zdroj: [6] SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Dynamika stisku počítačových kláves Definice: Detailní informace o časech, které v průběhu psaní uživatele na klávesnici přesně popisují, kdy byla která klávesa stlačena a kdy uvolněna. Synonyma: Dynamika psaní na klávesnici Zdroj: [7] SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Reference [1] Raghupathi W., Raghupathi V.: Big data analytics in healthcare: promise and potential. Health Information Science and Systems 2014, 2(3). doi: / [2] Schlenker A., Bohunčák A.: Keystroke Dynamics for Security Enhancement in Hospital Information Systems. International Journal on Biomedicine and Healthcare 2015; 3(1):41 44 [3] Kalina J.: Statistical Challenges of Big Data Analysis in Medicine. International Journal on Biomedicine and Healthcare 2015; 3(1):24 27 [4] Schlenker A.: Multifactor Data Security in Information Systems in Health Care. International Journal on Biomedicine and Healthcare 2014; 2(1):25 27 [5] Reimer M., Schlenker A. Ověřování identity na základě kontinuálního snímání dynamiky stisku počítačových kláves. Kladno, Bachelor thesis. České vysoké učení technické. [6] Badr Y., Chbeir R., Abraham A., Hassanien A.-E. (Eds.): Emergent Web Intelligence: Advanced Semantic Technologies, 1st Edition., 2010, XVI, 544, p.345 [7] Bergadano F., Gunetti D., Picardi C.: User authentication through Keystroke Dynamics. ACM Transactions on Information and System Security (TISSEC), 2002;5(4): Sémantická interoperabilita v biomedicíně a zdravotnictví
48 42 Sičová K. a kol. Sekundární katarakta u pacientů po implantaci multifokálních nitroočních čoček Sekundární katarakta u pacientů po implantaci multifokálních nitroočních čoček Kristína Sičová 1, Petr Výborný 1, Jiří Pašta 1 1 Oční klinika, Ústřední Vojenská nemocnice Vojenská fakultní nemocnice, Praha, Česká republika Kontakt: Kristína Sičová Oční klinika ÚVN Praha Adresa: U Vojenské nemocnice 1200, Praha 6 E mail: kristina.sicova@uvn.cz Cíle výzkumu V posledních letech roste ve vyspělých zemích počet prováděných operací zaměřených na pacienty ve středním a vyšším věku, kteří přicházejí do ordinace očního lékaře s požadavkem zbavit se závislosti na brýlové korekci anebo ji alespoň výrazně omezit. Tuto možnost nabízí refrakční chirurgie díky širokému spektru nitroočních čočkových implantátů. V České republice jsou v průběhu posledních let nejčastěji implantované multifokální difrakční nitrooční čočky. Jedná se o zákrok náročný nejenom na kvalitu provedení, erudici operatéra, spolupráci pacienta, ale zároveň i zákrok zatížený finančním doplatkem ze strany pacienta. Proto lze předpokládat, že pacient od operace vyžaduje co nejlepší výsledky a jakákoliv pooperační komplikace či zhoršená zraková ostrost se stává významným problémem. Nejčastější pozdní komplikací po jinak nekomplikované operaci je rozvoj opacifikace zadního pouzdra (PCO posterior capsule opacification) implantované nitrooční čočky, snižující zrakovou ostrost pacienta, která může vést až k rozvoji tupozrakosti, čili amblyopie. Tato problematika nabývá významu u pacientů po operaci s implantací prémiové nitrooční čočky se složitou optikou, kde každá eventuální komplikace výrazně snižuje či znehodnocuje možnost využití multifokální optiky. Cílem našeho výzkumu je vyhodnotit, jaké faktory vedou k rozvoji sekundární katarakty, zda její rozvoj ovlivňuje pouze způsob provedení operace, použitá operační technika a instrumentárium anebo přispívají i faktory ze strany pacienta, a to věk, pohlaví, další celkové onemocnění pacienta, přítomnost či nepřítomnost šedého zákalu předoperačně, jeho typ, či výše předoperační dioptrické refrakční vady. Na našem pracovišti provádíme refrakční zákroky s implantací prémiových nitroočních čoček již od roku 2005, a proto disponujeme poměrně velkým souborem pravidelně sledovaných pacientů. Tento fakt nám umožňuje jak retrospektivně vyhodnotit zaznamenaná data, tak i prospektivně, s využitím moderních objektivních zobrazovacích metod, sledovat zkoumanou problematiku. Současný stav poznání V současné době je známo, že za rozvoj opacifikace zadního pouzdra čočky je zodpovědná proliferace a migrace buněk čočkového epitelu (LEC- lens epithelial cells) zejména k v oblasti ekvátoru čočky. Následná katarakta má dvě patogenetické formy: fibrózní změny předního a zadního listu pouzdra čočky a regenerační ve smyslu novotvořených čočkových hmot. Na zrakovou ostrost mají vliv pouze opacity nacházející se v optické ose vidění. Kontakt optické části IOL (intraocular lens) s buňkami čočkového epitelu předního pouzdra vede k jejich diferenciaci na myofibroblasty, následně k fibrotizaci a rozvoji ACO (anterior capsule cataract), jejich migrací na zadní list dochází ke vzniku PCO. Na vzniku regeneračního typu sekundární katarakty se podílí proliferace a migrace LEC, které zůstaly při operaci v oblasti ekvátoru (tzv. E-buňky). Jednak se vytváří nové čočkové hmoty podél ekvátoru (Sommeringův prstenec), jednak migrují mezi zadní list pouzdra a IOL, kde vytváří tzv. Elschnigovy perly [1]. V prevenci vzniku sekundární katarakty byl prokázán vliv tvaru a materiálu IOL, peroperační i pooperační léčby, vliv samotné chirurgické techniky operace. Současným uznávaným preventivním postupem je implantace IOL do pouzdra původní čočky, použití IOL s ostrými zadními hranami, extenzivní čištění kapsuly. Přesto ani poté není vznik komplikací spojených s rozvojem sekundární katarakty výjimečný [2]. Po prvním roce od operace je sekundární kataraktou postiženo kolem 11% pacientů (v našem souboru 1,56%), po pěti letech po výkonu až 28% pacientů [3], (v našem souboru 2,34%) (Obrázek 1). Sémantická interoperabilita v biomedicíně a zdravotnictví
49 Sičová K. a kol. Sekundární katarakta u pacientů po implantaci multifokálních nitroočních čoček 43 Sekundární katarakta, i malého rozsahu, může vést k výraznému snížení zrakové ostrosti u pacientů s multifokální nitrooční čočkou. Horšení vidění se projeví zejména na blízkou vzdálenost. Tato malá, u monofokálních IOL nesignifikantní PCO se může rozvinout již půl roku od operace [6]. Nejčastější terapií zůstává NdYAG kapsulotomie. Tato nese sebou, ač malé, pořád riziko rozvoje trhlin v sítnici, odchlípení sítnice, vzniku sklivcových zákalků, posunu či decentrace nitrooční čočky a tím zhoršení její funkce. Tím se i přes precizně provedené měření síly nitrooční čočky, nekomplikované provedení operace a ze začátku klidný pooperační průběh mohou rozvinout dalekosáhlé komplikace a vyžádat si další chirurgický zásah, včetně vitreoretinální (sítnicové) chirurgie, hospitalizaci pacienta. Následkem může být trvalé snížení zrakové ostrosti pacienta, jeho invalidizace, omezení v pracovním či soukromém životě a tím i z toho plynoucí finanční následky jak ze strany pacienta, tak na straně zdravotnictví. Díky již zmíněnému rostoucímu zájmů jak fakochirurgů, tak pacientů o multifokální implantáty se aktuálnost této problematiky zvyšuje. Cílem očních chirurgů je snížit riziko vzniku sekundární katarakty na minimum a zachovat po co nejdelší dobu funkci těchto implantátů. V prozatímních výsledcích našeho výzkumu vidíme nižší incidenci sekundární katarakty, než je publikováno ve světové literatuře. Tento výsledek dle našeho názoru ovlivňují faktory, nezávislé na materiálu a typu nitroočního implantátu, a to námi vypracovaný systém pečlivého výběru vhodných kandidátů k operaci, protokol provedení operace a pooperační terapie, jakož i systém pooperačních kontrol, včetně zavedených přísných režimových opatření. Dovolíme si tvrdit, že výsledky našeho výzkumu mohou najít svoje uplatnění jak v kataraktové chirurgii, vitreoretinální chirurgii, ale i ve zdravotnictví jako takovém, při posouzení ekonomické efektivity jednotlivých postupů. Statistické vyhodnocení výsledků bude určitě zajímavým přínosem nejenom pro oční lékaře, ale díky pohledu na pacienta jako takového, včetně jeho interních onemocnění, věku, pohlaví, najdou výsledky uplatnění i v ostatních odvětvích medicíny, biomedicínské statistiky a možná pomohou i pacientům zvažujícím podstoupení operace. Obrázek 1: Procentuální vyjádření incidence sekundární katarakty po implantaci MIOL v průběhu let. Průměrná variace je od 10% do 40% tři až pět let od operace [4]. U některých typů IOL je to pouze 5% [5]. Uplatnění v biomedicíně a zdravotnictví Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Opacifikace zadního pouzdra čočky Definice: Zakalení čočkového pouzdra. Synonyma: Následná katarakta, sekundární katarakta, sekundární šedý zákal Zdroj: Vlková E., Pitrová Š., Vlk F., Lexikon očního lékařství, 2008; 355 SNOMED CT: MeSH: D ICD10: H264 Katarakta Definice: Zákal čočky v oku, který vede k rozptylu světla vstupujícího do oka a s postupujícím onemocněním k postupnému zhoršování vidění. Synonyma: Šedý zákal Zdroj: Vlková E., Pitrová Š., Vlk F., Lexikon očního lékařství, 2008; SNOMED CT: MeSH: D ICD10: H25 Nitrooční čočka Definice: Umělá čočka určena k trvalému uložení do oka. Zdroj: Vlková E., Pitrová Š., Vlk F., Lexikon očního lékařství, 2008; SNOMED CT: MeSH: D ICD10: Z961 Sémantická interoperabilita v biomedicíně a zdravotnictví
50 44 Sičová K. a kol. Sekundární katarakta u pacientů po implantaci multifokálních nitroočních čoček Multifokální nitrooční čočka Definice: Nitrooční čočka, která dokáže zaostřit na sítnici oka světelné paprsky přicházející z blízka i z dálky. Zdroj: Vlková E., Pitrová Š., Vlk F., Lexikon očního lékařství, 2008; SNOMED CT: MeSH: nenalezeno ICD10: Z961 NdYAG kapsulotomie Definice: Chirurgické protětí zadního pouzdra čočky vedoucí k odstranění druhotné katarakty neodýmovým laserem. Zdroj: Vlková E., Pitrová Š., Vlk F., Lexikon očního lékařství, 2008; SNOMED CT: MeSH: D ICD10: nenalezeno Reference [1] Sacu S., Menapace R., Findl O. et al. Influence of optic Eege design and anterior capsule polishing on posterior capsule fibrosis. Journal of cataract and refractive surgery, 2004; 30: [2] Krajčová P., Chynoranský M., Strmeň P. Opacifikácia zadného púzdra šošovky po implantácii rôznych typov umelých vnútroočných šošoviek - II. čast : rôzne peroperačné nálezy. Česká a slovenská oftalmologie, 2008; 64: [3] Bertelmann E., Kojetinsky C. Posterior capsule opacification. Current opinion in Ophthalmology, 2001; 12: [4] Pandey S.K., Apple D.J., Wener L. et al. Posterior capsule opacification: A review of ethiopathogenesis. Experimental and clinical studies and factors for prevention. Ophthalmology, 2004;52 : [5] Hayashi K., Hayashi H., Posterior capsule opacification in the presence of an intraocular lens with a sharp versus rounded optic edge, Ophthalmology, 2005; 112 : [6] Larkin H., PCO and premium lens, Eurotimes, 2012; 17(5): 4-6 Sémantická interoperabilita v biomedicíně a zdravotnictví
51 Slovák D., Zvárová J. DNA v biomedicínských aplikacích 45 DNA v biomedicínských aplikacích Dalibor Slovák 1,2, Jana Zvárová 1 1 Ústav hygieny a epidemiologie, 1. LF UK, Praha, Česká republika 2 Ústav zdravotnických informací a statistiky ČR Kontakt: Dalibor Slovák Ústav zdravotnických informací a statistiky ČR Adresa: Palackého nám. 4, Praha 2 E mail: dalibor.slovak@uzis.cz Cíle výzkumu Využití DNA je dnes v odborné i laické veřejnosti běžně přijímanou praxí. Využívá se v mnoha oblastech kriminalistiky: k identifikaci pachatelů zločinu, při určování otcovství, k identifikaci obětí hromadných neštěstí apod. S klesající cenou analýz se v poslední době rozmáhá použití DNA analýzy také v mnoha dalších směrech: zkoumání historických ostatků, sestavování rodokmenů a hledání příbuzenských vazeb a v neposlední řadě také v biomedicínských aplikacích. Současný stav poznání Prvním příkladem využití v medicínských vědách je Huntingtonova chorea. Expanze v počtu trinukleotidových repetitivních sekvencí u Huntingtonovy chorey zvyšuje pravděpodobnost výskytu nevyváženého psychického stavu. Při závažné trestné činnosti je možné posuzovat příčetnost jedince a schopnost jeho sebeovládání. Jako stav mimo normu se udává počet nad 35 repetitivních opakování. V české populaci je vrozený sklon ke zvýšenému srážení krve (trombofilie) poměrně vysoce rozšířen postihuje přibližně 8 % obyvatel. Nejvíce rizikovou skupinou jsou ženy užívající běžnou hormonální antikoncepci, u nichž je geneticky dán předpoklad ke zvýšenému srážení krve. Pro prevenci a minimalizaci problémů spojených se vznikem trombózy a tromboembolické nemoci je důležitá znalost genetických dispozic, nebot ohrožená osoba může na základě znalosti svých dědičných vloh vhodně přizpůsobit svou životosprávu a životní styl. Proto dochází k analýze trombofilních mutací i u dárkyň zárodečných buněk. Nejběžnější je faktor V Leiden (G1691A), způsobující rezistenci faktoru V k antikoagulační aktivitě APC proteinu. Jednou z motivací pro rozvoj personalizované medicíny je to, že účinek některých léků může být ovlivněn genetickou informací pacienta, tedy že odpověd organismu na léky může být geneticky determinovaná. Pro lékaře je důležité provést test ještě před zahájením léčby nebo při úvaze o jejím rozšíření či změně. Jedním z příkladů je gen VKORC1, jenž má 24 známých alel. Dvě z nich (CYP2C9-2, CYP2C9-3) zvyšují antikoagulační efekt warfarinu a snižují denní dávky potřebné k udržení INR (International Normalized Ratio) v terapeutickém rozsahu. V genu UGT1A1 je u nositelů alely 28 pozorována těžká toxicita Irinotecanu, léku používaného zejména při léčbě metastázujících nádorů tlustého střeva a rekta. Uplatnění v biomedicíně a zdravotnictví DNA má z hlediska testování dvě velké výhody. Lidská DNA se skládá z přibližně genů, některé z nich mají ale více transkriptů, takže znaků využitelných k odlišení je ještě více. Žádní dva lidé na světě nemají shodný celý genom, dokonce ani jednovaječná dvojčata. Druhou výhodou DNA je její všudypřítomnost. DNA se vyskytuje v každé buňce a zůstává na všech místech, kde se pohybujeme. Tato výhoda snadné dostupnosti je ovšem zároveň také nevýhodou. Díky citlivosti dnešních přístrojů je možno analyzovat i několik málo buněk. Při analýze takových vzorků se však často vyskytují směsné DNA vzorky nebo kontaminace nečistotami. Úměrně k tomu se zvyšuje důležitost zahrnutí všech možných stochastických jevů, spojených s laboratorním zpracováním, do výpočtu. Dalším problémem DNA analýzy je její restrikce na vybranou část genomu. Ve forenzní praxi není vyhodnocována celá DNA, ale je sestavován tzv. DNA profil. Jedním důvodem je cena: sekvenace genomu jednoho člověka již stojí méně než 1 milion USD a dále klesá, nicméně pro rutinní analýzy se jedná stále o velmi vysokou cenu. Druhým důvodem je citlivost údajů, které lze z DNA získat. Ve složitějších případech proto není jednoznačná identifikace možná a ke slovu se dostávají pravděpodobnostní modely, zahrnující různé množství parametrů. Tyto modely obvykle nějakým způsobem Sémantická interoperabilita v biomedicíně a zdravotnictví
52 46 Slovák D., Zvárová J. DNA v biomedicínských aplikacích počítají pravděpodobnost pozorování daného DNA profilu v populaci. Některé používané modely mohou kvůli jednoduchosti opomíjet parametry, které mohou být pro výsledek podstatné, nebo mohou tyto parametry zahrnovat do výpočtu špatným způsobem. Z toho vznikají chyby, které mohou zásadním způsobem změnit výsledek celé DNA analýzy. Jako memento je možné uvést případ popsaný v článku [1]: Autoři použili směsný vzorek DNA ze skutečného případu a předložili jej 17 zkušeným analytikům pracujícím v akreditované vládní laboratoři v USA, aniž by jim poskytli nějakou doplňkovou informaci, která by mohla vychýlit jejich rozhodnutí. Bylo dosaženo zcela protichůdných závěrů o tom, zda DNA podezřelé osoby koreluje se směsným vzorkem z místa činu. Pouze jeden analytik souhlasil s původním rozhodnutím v soudním procesu, že podezřelý nemůže být vyloučen jako potenciální pachatel. Čtyři analytici prohlásili, že důkazní evidence je neprůkazná, a zbylých 12, že podezřelého lze jako pachatele vyloučit. Následný průzkum laboratoří po celém světě ukázal, že existují výrazné nesrovnalosti v postupech doporučených pro interpretaci vzorků. Jak můžeme vidět, analýza DNA má také svá rizika. Je třeba sjednotit terminologii, zlepšit a standardizovat používané pravděpodobnostní modely a držet se doporučených postupů, nicméně ani při jejich dodržení nebude možné zcela odstranit stochastickou povahu některých jevů. Proto je nutné analýzu DNA vnímat jako důležitý, ale nikoli neomylný nástroj moderní vědy. Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Deoxyribonukleová kyselina Definice: Druh nukleové kyseliny, která je základem dědičné informace. Synonyma: DNA Zdroj: SNOMED CT: MeSH: D ICD10: nenalezeno Analýza DNA Definice: Metoda forenzních věd využívající biologický materiál obsahující DNA. Zdroj: SNOMED CT: MeSH: nenalezeno ICD10: nenalezeno Repetitivní sekvence Definice: Mnohonásobně opakované sekvence např. nukleotidů v DNA; představují velkou část lidského genomu. Synonyma: Repetitivní sekvence nukleové kyseliny Zdroj: SNOMED CT: MeSH: D ICD10: nenalezeno Trombofilie Definice: Vyšší sklon ke vzniku krevních sraženin. Zdroj: SNOMED CT: MeSH: D ICD10: D68.5 INR Definice: Krevní test používaný ke stanovení správného dávkování protisrážlivých léků. Synonyma: International Normalized Ratio, standardizovaný protrombinový čas Zdroj: SNOMED CT: MeSH: D ICD10: nenalezeno Reference [1] Geddes L. Fallible DNA evidence can mean prison or freedom. New Sci. 2010; 207 (2773): 8-11 Sémantická interoperabilita v biomedicíně a zdravotnictví
53 Stonová M. Nestrukturovaná data ve zdravotnictví založeném na důkazech 47 Nestrukturovaná data ve zdravotnictví založeném na důkazech Michaela Stonová lékařská fakulta Univerzity Karlovy, Praha, Česká republika Kontakt: Michaela Stonová 1. lékařská fakulta Univerzity Karlovy Adresa: Kateřinská 32, Praha 2 E mail: Michaela.Stonova@lf1.cuni.cz Cíle výzkumu Svatým grálem všech lékařů a informatiků je systém pro automatizované stanovování diagnóz. Pro jeho vytvoření je však nezbytné zvládnout několik vědeckých disciplín, mezi něž patří strojové zpracování přirozeného jazyka (NLP). 1 V průběhu jeho vývoje byl vytvořen vedlejší produkt, který by mohl být využit pro analýzu velkých objemů dat (Big Data) [3]. Zdravotnictví založené na důkazech (Evidence-based Healthcare) 2 je kriticky závislé na dostatečném množství relevantních podkladových dat. Lékařská dokumentace zaznamenaná ve formě volného textu tvoří až 80 % elektronické lékařské dokumentace (ELD). Jedná se tak o jedinečný zdroj dat, který byl však doposud přehlížen kvůli své obtížně analyzovatelné nestrukturované podobě. Získané znalosti a dovednosti při modelování českého NLP umožnily vytvořit následující systém pro velkoobjemové zpracování nestrukturované lékařské dokumentace. Současný stav poznání Přizpůsobení NLP českému lékařskému prostředí se stalo základním krokem na cestě k úspěšné analýze nestrukturovaných dat. Při výstavbě českého modelu byl brán zřetel nejen na jazykové disciplíny, jakými jsou tvarosloví, větná skladba a sémantika, ale rovněž na vysokou entropii jazyka lékařské dokumentace [7]. Vytvořený model byl otestován na elektronických záznamech pacientů pocházejících z nemocničního informačního systému (NIS) Ústřední vojenské nemocnice (ÚVN) v Praze. Testovací záznamy pocházely z různých ambulancí nemocnice (např. pohotovost, kardiologie, kožní oddělení, oční klinika atd.) Anonymizace záznamů proběhla již na úrovni extrakce souborů z NIS. Jméno pacienta i jeho ošetřujícího lékaře bylo smazáno a rodné číslo nahrazeno 1 Natural Language Processing. 2 Stejně jako jeho podmnožina medicína založená na důkazech (Evidence-based Medicine) [1]. 3 Textové soubory v UTF-8 kódování. 4 Dle MKN-10 kódu [4]. jedinečným číselným identifikátorem. Tento krok umožnil ochranu soukromí pacientů při současném zachování schopnosti provázat záznamy od jednoho konkrétního pacienta. Výsledkem tak byl soubor elektronických záznamů 3 v následující semi-strukturované podobě: věk;pohlaví;pacient;diagnóza; 4 volný text. 29;Muž;675032;H353 ;Pacient byl ošetřen... Velikost souborů se v testovací množině pohybovala v rozmezí od několika bytů (jednoslovné soubory s délkou 26 B) až po několik kilobytů (největší soubory s velikostí až 15,3 kb). Střední velikost souborů se rovnala 727 B a celkový objem všech souborů činil 1,6 GB. Lékařské záznamy byly zpracovány v systému IBM Watson Content analytics vycházejícího z projektu Apache Lucene. Všechna vstupní data byla standardně nakrolována, 5 rozparsována 6 a zaindexována 7 [5]. Pro hlubší analýzu medicínských dat bylo vytvořeno těchto pět ad hoc kategorií (nazývaných fazety): - Věk, - Pohlaví, - Pacient, - Diagnóza, - Léčiva. Fazeta Věk obsahuje podfazety pro každou životní dekádu, dvě zvláštní podfazety pro nezletilé a zletilé pacienty do 19 let (důvodem je skutečnost, že ÚVN se primárně zaměřuje na léčbu dospělých) a kategorii s označením Ostatní určenou pro novorozence a případné chyby v dokumentaci. Fazeta Pohlaví rozlišuje mezi mužskými a ženskými pacienty. Fazeta Pacient umožňuje ukázat všechny lékařské záznamy vybraného pacienta. Fazeta Diagnóza rozděluje nemoci do základních 22 skupin a jejich 276 podskupin dle MKN-10 kódů [4]. Poslední 5 Z angl. crawling načítání dat z vymezeného datového prostoru. V současnosti není ustanoven oficiální překlad tohoto termínu. 6 Rozdělení textu na jednotlivá slova.v současnosti není ustanoven oficiální překlad tohoto termínu. 7 Každé slovo je zaregistrováno a uloženy jeho vlastnosti (slovní druh, jazyk, speciální výraz apod.). Sémantická interoperabilita v biomedicíně a zdravotnictví
54 48 Stonová M. Nestrukturovaná data ve zdravotnictví založeném na důkazech fazeta Léčiva představuje ATC (Anatomical Therapeutic Chemical) klasifikační systém léčiv, který účinné látky začleňuje do různých skupin na základě jejich orgánového a systémového působení a dle jejich terapeutických, farmaceutických a chemických vlastností. Celkem podfazet kopíruje rozdělení léčiv do 14 základních skupin (první úroveň) a jejich příslušných podskupin až do páté možné úrovně. Na základě posledních dvou fazet je systém v současném stavu schopen rozpoznat a zařadit diagnóz dle MKN-10 kodů [4] a léčiv registrovaných Státním ústavem pro kontrolu léčiv, včetně např. nejnověji přidaných položek v ATC skupině L01X jiných cytostatik. 9 V průběhu zpracování bylo každé slovo jak lingvisticky rozpoznáno, tak i příslušně označeno, v případě, že bylo zařazeno do některé z fazet či podfazet. Všechny tyto vedlejší informace byly uloženy v 69 souborech indexu o celkové velikosti 4,8 GB. Pět přidaných fazet a standardní NLP zpracování navýšilo index do té míry, že se původní velikost vstupních dat (1,6 GB) ztrojnásobila. Jednou již zaindexovaná data je možno ihned analyzovat v IBM Watson Content Analytics grafickém rozhraní. Pouhým rozkliknutím příslušné fazety lze např. zjistit, že z záznamů, pacientů bylo mužského pohlaví a ženského. Většina z pacientů ( pacientů) navštívila ambulance opakovaně, zbylí zde byli ošetřeni pouze jednou ( pacientů). Celkově prošlo ambulancemi ÚVN různých pacientů, kteří byli léčeni na základě rozdílných diagnóz. 10 Předchozích výsledků bylo možno dosáhnout i cestou standardních databázových dotazů, nebot první čtyři části elektronických záznamů jsou ve strukturované formě. Zjištění, kolik kuřáků mezi pacienty bylo léčeno jinými cytostatiky (L01X ATC skupina) a pro jakou diagnózu, již není tímto případem. Informace o tom, zda je či není pacient kuřákem, je uložena ve volném textu lékařské dokumentace stejně jako předepsané léky. Analýza na základě obsahu textu nestrukturovaných dat je tak jedinou možností, jak dosáhnout výsledku. Základní model českého NLP dokáže filtrovat slova nejen na základě jejich základních tvarů, jimiž jsou v tomto případě kuřák nebo kuřačka nebo kouřit, ale automaticky rovněž i dle jejich odvozených forem. 11 Analýza na základě NLP objevila, že lékařské záznamy výslovně zmiňují kuřáků, z nichž 15 bylo podáno léčivo z ATC skupiny L01X. Výsledky, včetně příslušných diagnóz, jsou uvedeny v Tabulce 1. 8 Státní ústav pro kontrolu léčiv má zaregistrováno téměř léčiv. Většina z nich je však pod stejným jménem vyráběna více farmaceutickými firmami. Tyto duplicity umožnily snížit původní počet na hodnotu Zejména se jednalo o monoklonální protilátky a různé inhibitory. 10 Dle MKN-10 kódů. 11 Např. kouří, kouřil, kouřila, kuřácká, kuřákem, kuřácký atd. Tabulka 1: Pacienti kuřáci. Počet pacientů přicházejících na ambulanci v podnapilém stavu může být další úlohou pro analýzu nestrukturovaného textu. Pouze 244 lékařských záznamů bylo MKN-10 kódem jasně označeno jako přímo související s požívání alkoholu (MKN-10 kódy F100 a F102), avšak dalších 549 záznamů v textu výslovně zmiňovalo, že byl pacient opilý. Celkově tedy alespoň 793 patientů nebylo v době návštěvy ambulance ve střízlivém stavu (Tabulka 2). 12 Tabulka 2: Pacienti v podnapilém stavu. Navržený systém umožňuje rychlou analýzu 13 nestrukturovaných dat. Systém je schopný pracovat v režimu Big Data, a to až do velikosti v jednotkách terabytů. Poté, co jsou data již jednou nakrolována a zaindexována, analýza může být provedena v reálném čase. Jediným omezením je vysoká entropie jazyka lékařské dokumentace. V některých případech může tato nejasnost pozměnit výsledky analýzy. Tento jev a jeho dopad je přímo vidět v obou dvou tabulkách. Exponenciální zápis laboratorních výsledků ve formě x10 (např. Trombocyty: 12 Tabulka č. 2 ukazuje pouze diagnózy, jejichž četnost byla větší nebo rovna hodnotě K provedení analýzy kouřících pacientů i pacientů v podnapilém stavu bylo zapotřebí dvou minut, a to včetně exportu výsledných dat do csv souboru. 14 Systém záměrně nerozlišuje velká a malá písmena. Sémantická interoperabilita v biomedicíně a zdravotnictví
55 Stonová M. Nestrukturovaná data ve zdravotnictví založeném na důkazech x10ˆ9/l) je totožný 14 se zápisem MKN-10 kódu X10 pro Kontakt s horkými nápoji, potravou, tukem a oleji na vaření. Vysoký počet X10 diagnóz je v obou dvou případech chybný, ale v celkovém počtu souborů zanedbatelný. Tento typ chyby je více pravděpodobný u krátkých zkratek, avšak i delší slova, jakým je např. ketokonazole mohou způsobit jisté dezinterpretace. Ketokonazole může být jak topickým antimykotikem (ATC skupina D01AC08), tak i hormonálním supresantem (ATC skupina H02C). O jaký případ se jedná, lze v obou případech zjistit pouze z kontextu. Navzdory skutečnosti, že zmíněné chyby mají malý dopad na výsledky v rozsahu Big Data, příští kroky výzkumu povedou ke zmírnění jejich dopadu. Další výzkum tak bude zaměřen na zlepšení kontextové analýzy a opravu pravopisných chyb. Uplatnění v biomedicíně a zdravotnictví Navržený systém je schopen zpracovat terabyty lékařské dokumentace a je nezávislý na formátu vstupních dat. Lze jej tak využít bez nutnosti dalšího přizpůsobení. Automatická klasifikace nestrukturovaných dat na základě věku, pohlaví, diagnózy a použitých léčiv je již součástí základního nastavení. Systém tak umožňuje provádět přehledovou analýzu lékařské dokumentace a dalších nestrukturovaných zdravotnicích dat s dostačující přesností. Zmíněné nepřesnosti způsobené vyšší entropií jazyka lékařské dokumentace budou předmětem dalšího výzkumu. Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Synonyma: Evidence-based Medicine Zdroj: Cochrane collaboration org/ SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno NLP Definice: Odvětví informatiky, které se zabývá automatizovaným zpracováním přirozeného jazyka. Synonyma: Human Language Technology, Natural Language Processing Zdroj: The Free Dictionary com/natural+language+processing SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Nestrukturovaná data Definice: Data, která nejsou uchovávána v databázi nebo v jinak předdefinované struktuře. Synonyma: Nestrukturované informace Zdroj: The Free Dictionary thefreedictionary.com/unstructured+data Kĺıčová slova Big Data Definice: Velkobjemové zpracování rozdílných druhů dat v reálném (či přiměřeně akceptovatelném) čase. Zdroj: Gartner big-data SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Medicína založená na důkazech SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Strukturovaná data Definice: Data, která jsou uchovávaná v přesně definované struktuře. Synonyma: Strukturované informace Zdroj: Webopedia S/structured_data.html SNOMED CT: nenalezeno Definice: Vědomé, zřetelné a soudné používání nejlepších současných důkazů při rozhodování o péči o jednotlivé pacienty. MeSH: nenalezeno ICD10: nenalezeno Sémantická interoperabilita v biomedicíně a zdravotnictví
56 50 Stonová M. Nestrukturovaná data ve zdravotnictví založeném na důkazech Reference [1] Cochrane Collaboration, Available from: [2] Hartzband P, Groopman J. Untangling the Web Patients, Doctors, and the Internet. N Engl J Med 2010; 362: [3] Holzinger A, Stocker C, Ofner B, Prochaska G, Brabenetz A, Hofmann-Wellenhof R. Combining HCI, Natural Language Processing, and Knowledge Discovery Potential of IBM Content Analytics as an Assistive Technology in the Biomedical Field. Human-Computer Interaction and Knowledge Discovery in Complex, Unstructured, Big Data.2013; 7947: [4] Institute of Health Information and Statistics of the Czech Republic, Available from: [5] Stonová M. Unstructured Data in Healthcare. Semantic Interoperability in Biomedicine and Healthcare. IJBH 2014; 2(1): [6] State Institute for Drug Control, Available from: [7] Zvolský M. Automating the Use of Clinical Practice Guidelines in the Health Information Infrastructure. Semantic Interoperability in Biomedicine and Healthcare. IJBH 2014; 2(1): Sémantická interoperabilita v biomedicíně a zdravotnictví
57 Šaňková B. a kol. Vývoj převodního systému u myši 51 Vývoj převodního systému u myši Barbora Šaňková 1,2, Jiří Beneš 1,2, David Sedmera 1,2 1 Anatomický ústav, 1. lékařská fakulta, Univerzita Karlova v Praze, Praha, Česká Republika 2 Fyziologický ústav, AVČR, v.v.i., Praha, Česká Republika Kontakt: Barbora Šaňková Anatomický ústav, 1. lékařská fakulta Adresa: U Nemocnice 3, Praha 2 E mail: bara.sankova@centrum.cz Cíle výzkumu Převodní systém srdeční vývoj a funkce Elektrický impulz se tvoří ve specializované tkáni pacemakeru, sinoatrialním uzlu, umístěném v pravé předsíni u vstupu horní duté žíly. Z místa vzniku postupuje elektrický vzruch rychle vedoucí tkání myokardu předsíní až do atrioventrikulárního uzlu, umístěného na rozhraní předsíní a komor. Díky pomalému vedení vzruchu atrioventrikulárním uzlem dochází ke vzniku zpoždění, nezbytného pro efektivní plnění komor během diastoly. Vzruch je šířen ze sinoatrialního uzlu rychle vedoucími částmi převodního systému srdečního Hisovým svazkem, následně Tawarovými raménky až do distálních větviček Purkyňových vláken, které aktivují pracovní myokard komor. Silnější svazky komorového převodního systému jsou elektricky izolované od okolní tkáně. K narušení izolace dochází v distálních částech Purkyňova sytému, to umožňuje přímé spojení s pracovním myokardem s následnou aktivací myokardu komor směrem od apexu k bázi a také aktivace od endokardu k epikardu. Jednotlivé části srdečního převodního systému se během vývoje diferencují specifickým způsobem, který je morfogeneticky zachován. Tato morfogenetická posloupnost se shoduje u kuřete, myši i u člověka [4]. Pacemaker je první funkční oddíl převodního systému identifikovatelný u stádia trubicovitého srdce, u myši k tomu dochází kolem embryonálního dne (ED) 7,5. Srdeční impulz se šíří pomalu, izotropním způsobem ze sinus venosus, umístěného kaudálně, primitivní komorou dále kraniálním směrem k výtokové části [5]. Ve stádiu srdeční kličky (myš ED 8) se objeví pomalu vodivý atrioventrikulární kanál, který odděluje rychleji vodivé oblasti předsíní a komor. Segmenty pomalu vedoucí elektrický vzruch (atrioventrikulární kanál, výtoková část a sinoatriální oblast) fungují jako svěrače, jejichž kontrakce jsou koordinované, a tím je zvýšena efektivita krevní cirkulace. Komorová aktivační sekvence ve fázi srdeční kličky kopíruje průtok krve. Ve vývojovém období před septací srdce (myš ED 9,5 12,5) se objevuje primitivní aktivační vzor primární interventrikulární prstenec (primary interventricular ring), přednostně vedoucí aktivaci podél budoucí mezikomorové přepážky [11]. Rychle vodivý komorový převodní systém je poslední část, která se diferencuje, jejíž funkčnost se projeví změnou ventrikulární aktivační sekvence. Nezralá aktivační sekvence kopírující tok krve od srdeční báze směrem k apexu je nahrazena aktivací opačným směrem od vrcholu k bázi. Zralá aktivační sekvence od apexu k bázi se objevuje s dokončeným interventrikulárním septem u kuřete [3, 8], zatímco u myši se mění aktivace dříve ve vývoji, před dokončením interventrikulárního septa [9]. Funkčnost srdečního převodního systému lze nejlépe hodnotit pomocí vysokorychlostního optického mapování, hlavní metody použité v této studii. Během optického mapování je použit systém virtuálních elektrod, fluorescenční barvivo rychle reagující na změny elektrického potenciálu a vysokorychlostní kamera sloužící ke sběru dat. Optické mapování poskytuje in vivo fyziologické údaje epikardiální aktivační mapy, vznikající analýzou dat z optického mapování a beroucí v úvahu časoprostorovou osu. Z aktivační mapy mohou být vyhodnoceny první aktivovaná místa na epikardiálním povrchu a směr vedení elektrického vzruchu, dohromady tvořící vzor komorové aktivační sekvence, ukazatel zralosti převodního systému. Dalším parametrem, který lze hodnotit z aktivačních map, je rychlost šíření elektrického impulzu epikardem. Normální vývoj myšího převodního systému Morfologie a vývoj převodního systému u myši byly popsány histologicky v sedmdesátých letech, nejnověji však optické mapování umožnuje studium jeho funkčního zapojení. V současné době chybí kvantitativní hodnocení aktivačních časů komor a aktivačních vzorů, nezbytných pro interpretaci změn pozorovatelných u transgenních myších modelů, kde lze předpokládat možný vliv na vývoj převodního systému. Pomocí metody optického mapování jsme studovali funkci převodního systému u myši počínaje ED 9,5. Měřili jsme celkový aktivační čas levé komory a hodnotili způsob Sémantická interoperabilita v biomedicíně a zdravotnictví
58 52 Šaňková B. a kol. Vývoj převodního systému u myši aktivace komor zařazením do jedné kategorie aktivačních vzorů; aktivace využívající primární interventrikulární prstenec, levého Tawarova raménka (LBB), pravého Tawarova raménka (RBB), obou ramének, přechodný způsob. Typická situace v daném ED je reprezentována spektrem několika aktivačních vzorů, a proto není možné popsat normální vývoj analýzou méně než 10 embryí ve skupině. První primitivní aktivační vzor, který se objeví v časném vývoji převodního sytému u myši, je aktivace pomocí primárního interventrikulárního prstence. Na rozdíl od kuřete, kde je první aktivace od báze k apexu, nebyl typ aktivace od báze k apexu nikdy pozorován u myši. Vedení elektrického impulzu v rozmezí ED 9 11 je charakteristické tím, že je využit primární interventrikulární prstenec, struktura v oblasti budoucího interventrikulárního septa. Jak pokračuje vývoj srdce, postupně mizí aktivace pomocí primárního interventrikulárního prstence (ED 12,5 se vyskytuje naposled) a je nahrazována aktivací pomocí Tawarových ramének. Z komorového převodního systému je první aktivní LBB, ale s výskytem přechodného typu aktivace. V ED 11,5 se stává aktivní RBB nebo obě raménka. V ED 14,5 je většina srdcí aktivovaných ze dvou center, ale ojediněle bylo první aktivované místo jen na jedné straně. Šíření elektrického impulzu se urychluje nejvýrazněji ve vývojovém okně mezi ED 10,5 12,5, což vyplývá z porovnání aktivačních časů u jednotlivých ED. Aktivační čas zůstává v pozdějších stádiích na stejných hodnotách jako v předchozích ED, ale není zohledněn fakt, že srdce stále roste. Zhodnocení normálního vývoje aktivace komor poskytuje nezbytný rámec pro analýzu transgenních myší s potenciálními vadami převodního systému. Pro interpretaci změn pozorovaných u myších modelů je nutné systematické a kvantitativní studium aktivačních sekvencí. Jako pozadí byla použita získaná data během analýz myší postrádající geny pro Cx40 [11, 2], Tbx2, Ptx2 [1], ErbB2 a v myším modelu se syndromem dlouhého QT intervalu [10]. Nedostatek Cx40 Cx40 je hlavní protein vodivých buněčných spojů (gap junction) exprimovaný v předsíních a komorách v časných fázích embryogeneze. Jak embryogeneze pokračuje, exprese Cx40 v předsíních se nemění, ale v komorách se postupně omezuje na trabekuly, až je dosaženo exprese pouze v komorovém převodním systému u dospělých (Tawarova raménka, Purkyňova vlákna). Nedostatek Cx40 způsobuje embryonální a atriální anomálie ve vedení elektrického impulzu [7], pomalejší vedení vzruchu a blok pravého Tawarova raménka [13, 15, 6]. Nicméně funkční význam Cx40 během vývoje převodního systému nebyl doposud studován. Ve ED 12,5 a ED 14,5 bylo pozorováno různorodé vedení rychlosti vzruchu předsíněmi v závislosti na Cx40 genotypu. U divokého typu (WT) a heterozygotních embryí bylo první aktivované místo v oblasti sinoatriálního uzlu, u heterozygotů byl mírně prodloužený čas epikardiální aktivace (statistický významný ED 12,5). U myší bez Cx40 se objevily dvě atriální aktivační sekvence, aktivace ze sinoatriálního uzlu a ektopická aktivace pocházející z pravého ouška. Dále se vliv nedostatku Cx40 projevil prodloužením doby aktivace, která byla výrazně zpomalena hlavně u ektopicky aktivovaných předsíní a u ED 12,5 v porovnání s ED 14,5. Chybějící Cx40 během vývoje ovlivňuje aktivační sekvence šíření vzruchu v atriích a výrazně zpomaluje rychlost šíření, která je v přímé korelaci s typem atriální aktivace. Rozdíly mezi genotypy při analýze aktivačních časů komor nebyly pozorovány. Sledování četnosti aktivačních sekvencí u komor odhalilo značný pokles frekvence aktivace pomocí levého Tawarova raménka na ED 12,5 a ED 14,5 u Cx40 deficientních myší. U heterozygotů byla četnost výskytu také snížena, ale v menším rozsahu. Podíl aktivačních sekvencí se začal obracet v ED 16,5, kde byla aktivní LBB přítomna u všech genotypů v téměř plném rozsahu. Frekvence pravostranné aktivace RBB začala klesat u myší s Cx40 deficitem, což naznačuje rozvoj dysfunkce pravého Tawarova raménka. Nejvýraznější fenotyp byl zaznamenán v ED 18,5, kde srdce bez Cx40 měla funkční RBB pouze v 33% případech na rozdíl od 96% u heterozygotů a 94% WT. Současný stav poznání Studie byla dokončena a data publikována [11, 1, 10, 2]. Optické mapování a whole mount konfokální mikroskopie představují nejmodernější techniky pro studium fyziologických a morfologických vlastností embryonálních tkání. Obě tyto metody jsou nyní dobře zavedené na 1.LF UK. Uplatnění v biomedicíně a zdravotnictví Pochopení mechanismů signalizace vývoje převodního systému může mít význam pro klinické pracovníky a vědce v základním výzkumu studující srdeční onemocnění u dospělých. Vrozené vady spolu s ektopickou nebo nevhodnou indukcí převodních tkání jsou procesy, které přispívají k arytmií u dospělých. Arytmie představují skupinu kardiovaskulárních chorob, které významně přispívají k morbiditě a mortalitě v populaci. Poděkování Tato studie byla částečně finančně podpořena z prostředků SVV projekt Univerzity Karlovy, MSMT VZ , AS CR AVOZ , GACR 304/08/0615. Sémantická interoperabilita v biomedicíně a zdravotnictví
59 Šaňková B. a kol. Vývoj převodního systému u myši 53 Kĺıčová slova Optické mapování Definice: Zobrazovaní na napětí závislým barvivem. Synonyma: Mapování akčního potenciálu Zdroj: [12] SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Blok pravého Tawarova raménka Definice: Forma srdečního bloku, kdy je elektrický impulz pro komory přerušen. Synonyma: Blok raménka Zdroj: [14] SNOMED CT: MeSH: D ICD10: I45.1 Konexin 40 Definice: Protein spojení typu gap junction. Synonyma: transmembranový protein genu Gja5 Zdroj: [6] SNOMED CT: nenalezeno MeSH: C ICD10: nenalezeno Reference [1] Ammirabile G, Tessari A, Pignataro V, Szumska D, Sardo FS, Benes J, Jr., Balistreri M, Bhattacharya S, Sedmera D, Campione M Pitx2 confers left morphological, molecular, and functional identity to the sinus venosus myocardium. Cardiovasc Res 93: [2] Benes J Jr, Ammirabile G, Sankova B, Campione M, Krejci E, Kvasilova A, Sedmera D The role of connexin40 in developing atrial conduction. FEBS Lett Apr 17;588(8): [3] Chuck ET, Freeman DM, Watanabe M, Rosenbaum DS Changing activation sequence in the embryonic chick heart. Implication for the development of the His-Purkinje system. Circ Res 81: [4] Gourdie RG, Harris BS, Bond J, Justus CHKW, O Brien TX, Thompson RP, Sedmera D Development of the Cardiac Pacemaking and Conduction System. Birth Defects Research 69: [5] Kamino K Optical approaches to ontogeny of electrical activity and related functional organization during early heart development. Physiol Rev 71: [6] Kirchhoff S, Nelles E, Hagendorff A, Kruger O, Traub O, Willecke K. Reduced cardiac conduction velocity and predisposition to arrhythmias in connexin40-deficient mice. Curr Biol 1998;8: [7] Leaf DE, Feig JE, Vasquez C, Riva PL, Yu C, Lader JM et al. Connexin40 imparts conductionheterogeneity to atrial tissue. Circ Res 2008;103: [8] Reckova M, Rosengarten C, dealmeida A, Stanley CP, Wessels A, Gourdie RG, Thompson RP, Sedmera D Hemodynamic is a key epigenetic factor in development of the cardiac conduction system. Circ Res 93: [9] Rentschler S, Vaidya DM, Tamaddon H, Degenhardt K, Sassoon D, Morley GE, Janife J, Fishmann GI Visualization and functional characterization of the developing murine cardiac conduction system. Development 128: [10] de la Rosa AJ, Dominguez JN, Sedmera D, Sankova B, Hove- Madsen L, Franco D, Aranega A Functional suppression of Kcnq1 leads to early sodium channel remodeling and cardiac conduction system dysmorphogenesis. Cardiovasc Res Jun 1;98(3): [11] Sankova B, Benes JJ, Krejci E, Dupays L, Thevenian-Ruissy M, Miquerol L, Sedmera D The effect of connexin40 deficiency on ventricular conduction system function during development. Cardivas Res:doi: /cvr/cvs1210. [12] Sedmera D, Reckova M, Rosengarten C, Torres MI, Gourdie RG, Thompson R P Optical Mapping of Electrical Activation in the Developing Heart. Micros Microanal 11: [13] Simon AM, Goodenough DA, Paul DL. Mice lacking connexin40 have cardiac conduction abnormalities characteristic of atrioventricular block and bundle branch block. Curr Biol 1998;8: [14] Stejfa M et al Kardiologie. Grada. 776p. [15] Tamaddon HS, Vaidya D, Simon AM, Paul DL, Jalife J, Morley GE. High-resolution optical mapping of the right bundle branch in connexin40 knockout mice reveals slow conduction in the specialized conduction system. Circ Res 2000;87: Sémantická interoperabilita v biomedicíně a zdravotnictví
60 54 Šteffl M., Plzák J. Výskyt mikrobiální flóry nosních průchodů a její vliv na rozvoj chronických rhinosinusitid Výskyt mikrobiální flóry nosních průchodů a její vliv na rozvoj chronických rhinosinusitid Martin Šteffl 1, Jan Plzák 1 1 Klinika otorinolaryngologie a chirurgie hlavy a krku, 1. LF UK, FN v Motole Kontakt: Martin Šteffl Klinika otorinolaryngologie a chirurgie hlavy a krku, 1. LF UK, FN v Motole Adresa: V Úvalu 84, Praha 5 E mail: martin.steffl@fnmotol.cz Cíle výzkumu Cílem projektu je analýza mikrobiálních komunit, vyskytujících se v dutinách nosních a jejich porovnání u pacientů s chronickou rhinosinusitidou at již s polypy, či bez nich, oproti zdravým kontrolám, čili pacientům bez postižení sinonasálního traktu. Vědeckou otázkou tedy jest: Jakou roli hrají změny ve složení mikroflóry dutiny nosní při vzniku chronických rhinosinusitid, jejich podtypů a jaká je jejich případná korelace s klinickým nálezem? Analýza bude narozdíl od většiny předchozích studií, které šly cestou kultivace bakterií, probíhat moderními metodami využívanými v molekulární biologii [2]. Bude se tedy jednat o analýzu DNA, která bude získávána z nosních stěrů a bioptických vzorků z nosních sliznic. Bakteriální DNA získaná ze vzorků od pacientů bude amplifikována pomocí specifických primerů, určených k amplifikaci 16S bakteriální DNA, jež obsahuje jak konzervativní, tak variabilní úseky. Ta bude nakonec sekvenována. U jednotlivých pacientů budou zároveň prováděna doplňková klinická a paraklinická vyšetření. Tato data pak budou korelována k datům laboratorním. Dalším výstupem může být i porovnání získaných dat s ostatními studiemi, a to jak s těmi realizovanými cestou kultivace, tak i s těmi provedenými metodami založenými na analýze nukleových kyselin. V tomto případě bude jistě zajímavá případná rozdílnost výsledků v závislosti na použité metodice. Současný stav poznání Chronická rhinosinusitida je poměrně častým onemocněním (5-15% populace v Evropě a USA) postihujícím horní cesty dýchací. Přesná etiologie je bohužel neznámá. Pravděpodobně se však jedná o onemocnění multifaktoriální [1]. Je charakterizovaná jako lokální zánět postihující nosní průchody a paranazální dutiny, jež perzistuje déle než 12 týdnů. Chronické rhinosinusitidy rozdělujeme do dvou fenotypů, a to v závislosti na přítomnosti nosních polypů. Konkrétně tedy na chronickou rhinosinusitidu s přítomností polypů a chronickou rinosinusitidu bez přítomnosti polypů [3]. Jedná se o onemocnění výrazně zhoršující kvalitu života a snižující pracovní produktivitu. Jsou spojené zejména se zhoršenou nosní průchodností, bolestmi hlavy, ztrátou čichu. Na jejich léčbu se ročně vynaloží nemalé množství finančních prostředků. Léčba je navíc ve většině případů pouze symptomatická a dochází tak k častým recidivám onemocnění a mnoho případů vyžaduje opakované chirurgické intervence [3]. V předchozích studiích byl prokázán výskyt různých druhů mikrobů v oblasti nosních průchodů a vedlejších dutin nosních. Nebyla však prokázána přímá souvislost mezi vznikem onemocnění a jednotlivým původcem či skupinou původců. Příčinou onemocnění je chronický zánět sliznice dutin. Faktory, které zapříčiňuji tento zánět, jsou genetické změny, alergie, infekce, přestavba sliznice a poruchy imunomodulace [5]. U tohoto onemocnění pak vyvolávají zvýšenou infiltraci sliznice eosinofily, neutrofily, lymfocyty a makrofágy, abnormální regulaci Th1, Th2 a regulačních lymfocytů, poruchy slizniční, specifické i nespecifické imunity, poškození epitelií následované aberantní přestavbou, změny v pochodech ikosanoidů a fibrózu a otok. Otázkou je však přesný mechanismus, který zapříčiňuje vznik a přetrvávání těchto změn. A to zda-li přítomné bakterie slouží jako původce infekce a zánětu [4]. Dle současného poznání se tento vliv předpokládá. Avšak interpretace a porovnání předešlých studií jsou značně složité. Výsledky jsou často závislé na místě a způsobu odběru materiálu. Avšak i přes tyto rozdíly byla prokázána rozdílná mikrobiologie u chronických a akutních rinosinusitid [3]. Sémantická interoperabilita v biomedicíně a zdravotnictví
61 Šteffl M., Plzák J. Výskyt mikrobiální flóry nosních průchodů a její vliv na rozvoj chronických rhinosinusitid 55 Uplatnění v biomedicíně a zdravotnictví Výsledkem by mělo být zjištění, zda-li a jak se liší osídlení sinonasálního traktu u pacientů s chronickou rhinosinusitidou a u zdravých jedinců a jaký mohou mít tyto mikroorganizmy vliv na rozvoj tohoto onemocnění, což by ve výsledku mohlo ovlivnit strategii léčby chronických rhinosinusitid. Dalším zjištěním by mělo být, zda-li a jak lze aplikovat nové molekulární metody do diagnostiky infekčních rhinosinusitid, jejich výhody a nevýhody oproti standardním kultivačním postupům. Poděkování Výzkum podpořen SVV projekt Karlovy Univerzity v Praze. Kĺıčová slova Chronická rhinosinusitida Definice: Zánět sinonazálního traktu přetrvávající déle než 12 týdnů. Synonyma: Rinitida, sinusitida Zdroj: otolaryngology/specialty_areas/sinus_ center/conditions/sinusitis.html SNOMED CT: MeSH: D012220, D ICD10: J31.0, J32 Nosní polypy Definice: Měkké, nebolestivé, nezhoubné výrůstky nosních či vedlejších dutin nosních. Synonyma: Výchlipky nosní sliznice Zdroj: diseases-conditions/nasal-polyps/basics/ definition/con SNOMED CT: MeSH: D ICD10: J33 Sekvenování nukleových kyselin Definice: Určování přesného pořadí nukleotidů v molekule DNA. Synonyma: Molekulárně genetická analýza Zdroj: DNA_sequencing SNOMED CT: MeSH: D ICD10: nenalezeno Mikrobiom Definice: Sbírka genomů mikrobů v systému. Synonyma: Mikrobiota Zdroj: microbe.net/2015/04/08/what-does -the-term-microbiome-mean-and-where-did -it-come-from-a-bit-of-a-surprise/ SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Reference [1] Frank, D., Feazel, L., Bessesen, M., Price, C., Janoff, E., & Pace, N. (2010). The Human Nasal Microbiota and Staphylococcus aureus Carriage. PLoS ONE. [2] Stressmann, F., Rogers, G., Chan, S., Howarth, P., Harries, P., Bruce, K., & Salib, R. (2011). Characterization of bacterial community diversity in chronic rhinosinusitis infections using novel culture-independent techniques. Am J Rhinol Allergy American Journal of Rhinology and Allergy, [3] Kennedy, D. (2012). Rhinology diseases of the nose, sinuses, and skull base. New York: Thieme. [4] Kato, A. (n.d.). Immunopathology of chronic rhinosinusitis. Allergology International, [5] Li, C., Shi, L., Yan, Y., Gordon, B., Gordon, W., & Wang, D. (2012). Gene Expression Signatures: A New Approach to Understanding the Pathophysiology of Chronic Rhinosinusitis. Curr Allergy Asthma Rep Current Allergy and Asthma Reports, Sémantická interoperabilita v biomedicíně a zdravotnictví
62 56 Veselá Flórová Z. et al. Léčba glaukomu za 1 Kč denně sen nebo realita? Léčba glaukomu za 1 Kč denně sen nebo realita? Zuzana Veselá Flórová 1, Petr Výborný 2, Silvia Sičáková 2, Jiří Obenberger 3 1 Oční klinika JL Praha, s.r.o., Česká republika 2 Oční klinika 1.LF UK a ÚVN Vojenská fakultní nemocnice Praha, Česká republika 3 Radiodiagnostická klinika FNB a 1. LF UK Praha, Česká republika Kontakt: Zuzana Veselá Flórová Oční klinika JL Praha, s.r.o. Adresa: V Hůrkách 1296/10, Praha 5, Česká republika E mail: zuzanaflorova@centrum.cz Cíle výzkumu V poslední době jsme se v oftalmologické praxi setkali s problémem výrazného omezení preskripce fluorovaných chinolonů E, OPH [3]. Omezení vyplývající ze správního rozhodnutí Státního úřadu pro kontrolu léčiv (SÚKL) zaskočila odbornou veřejnost. Situace, která nastala, nás motivovala k tomu, abychom se začali zajímat o procesy související se stanovením úhrady léčivých přípravků. Pokusíme se přiblížit tuto problematiku a v následujícím textu je podáván výběr z agendy týkající se skupiny antiglaukomatik. [4] Kolik konkrétně odčerpá ze systému zdravotního pojištění konzervativní léčba pacienta s glaukomem? Jak jsou hrazeny oční kapky? Kolik vynaloží stát na léčbu tohoto závažného onemocnění jednotlivými terapeutickými skupinami? Současný stav poznání K dispozici odborné veřejnosti i laikům jsou volně přístupné webové stránky státních institucí v tomto případě Ministerstva zdravotnictví a SÚKL [1, 2]. Těchto materiálů lze využít jako relevantního zdroje informací z oblasti lékové politiky. Zde najdeme celou řadu podrobností z průběhu jednání o stanovení úhrad příslušných terapeutických skupin. Je zde možno vyčíst několikaletou chronologii procesu stanovení úhrady, námitky a připomínky farmaceutických firem, které se snaží upřednostnit svůj přípravek a získat pro něj procentuální bonifikaci, protože některé publikace mluví v jeho prospěch. Jiné publikace však naopak hovoří ve prospěch přípravku jiné firmy, a jsou tedy z logiky věci uváděny konkurencí. Z materiálů lze i vyčíst, jaký je mechanismus hodnocení těchto námitek SÚKL, a co je základem pro konečné rozhodnutí o výši úhrady [1, 2]. Konkrétní výsledek je alarmující obvyklá denní terapeutická dávka (ODTD) pro betablokátory má stanovenou základní úhradu necelou 1 Kč (0,9412 Kč), ODTD pro analoga prostaglandinů 5 Kč (5,0807 Kč) a skupina léčivých přípravků v zásadě terapeuticky zaměnitelných s léčivými přípravky s obsahem fixní kombinace timololu a prostaglandinových analogů má stanovenou základní úhradu za ODTD 5,5537 Kč [1]. Aplikace v biomedicíně a zdravotnictví SÚKL má za to, že výsledky hodnocení nákladové efektivity provedené v jiných státech nelze paušálně převést na zdravotnické prostředí ČR, jelikož při adaptaci zahraničních hodnocení je nezbytné zohlednit charakter léčebné praxe, intenzitu čerpání zdrojů, výši nákladů, definici cílové populace a jiné klíčové předpoklady specifické pro prostředí běžné klinické praxe v ČR [1]. Správní řízení probíhají zpravidla řadu měsíců [2]. Výsledkem je plánovaná roční úspora v řádu miliónů. Na základě výše úhrady předmětné skupiny v zásadě terapeuticky zaměnitelných přípravků odhaduje SÚKL, že dopad na prostředky veřejného zdravotního pojištění bude následující úspora nákladů: při léčbě betablokátory přibližně Kč, při léčbě prostaglandiny přibližně Kč, při léčbě kombinacemi prostaglandinu a timololu přibližně Kč. Odhad byl zpracován na základě spotřeb přípravků za rok 2012 a porovnáním s úhradou platnou k [1, 2]. Celková předpokládaná úspora dosažená s pomocí těchto tří správních řízení tedy dosahuje necelých 120 miliónů Kč. Jaké je plánované využití této částky? Jaké další otázky se naskýtají? Je možné, aby úhrada ze zdravotního pojištění u denní léčby glaukomu byla u tak rozšířené skupiny, jako jsou lokální betablokátory [3], oceněna méně než na hodnotu nejnižší mince, která je v ČR v oběhu? Co bude následovat? Jaký bude dopad dalších revizí? Budeme mít nejnižší náklady na jednotlivé léky ze zdravotního pojištění v Evropě? Jaké bude portfolio očních kapek k léčbě glaukomu za několik let? Přijdou vůbec na trh Sémantická interoperabilita v biomedicíně a zdravotnictví
63 Veselá Flórová Z. et al. Léčba glaukomu za 1 Kč denně sen nebo realita? 57 nové léky při takto nízké úhradě a systému jejich tvorby? Vyplatí se firmě náklady spojené s registrací léku? Kolik je pacient ochoten doplácet v lékárně? Jsou některé oční kapky s neakceptovatelnými doplatky prakticky obchodovatelné? Bude za stávajících podmínek ze strany držitele registrace léku, který je nyní součástí běžné klinické praxe, zájem o její prodloužení? Kolik léků přestane být k dispozici? Budou u nás distribuovat antiglaukomatika pouze generické firmy? Kolik jich bude? Snaha o úsporu nákladů na léčivé přípravky hrazené ze zdravotního pojištění by mohla mít při pokračujícím restriktivním trendu i své negativní stránky. [1] V nepříliš vzdáleném časovém horizontu by mohlo dojít k zúžení terapeutického portfolia, které bude pacientům a lékařům k dispozici při léčbě závažných očních chorob se sociálně ekonomickým dopadem. Je třeba si uvědomit, že praktický výsledek těchto opatření se plně projeví s latencí několika let. Je důležité o této problematice diskutovat již nyní. Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Glaukom Definice: Glaukom je skupina klinicky odlišných onemocnění různé etiologie, která způsobují neuropatii zrakového nervu a vedou k ireverzibilnímu poškození zrakových funkcí. Je to onemocnění multifaktoriální, pro jehož rozvoj je důležitým rizikovým faktorem zvýšený nitrooční tlak. Zdroj: Glaukom SNOMED CT: MeSH: C ICD10: H40-H42 Lék Definice: Lék je léčivo upravené do definitivní podoby, v jaké se používá a podává pacientovi (člověku nebo zvířeti). Pojem lék je definován ve farmakologii (zabývá se léky). Na rozdíl od pojmů léčivo, léčivá látka a léčivý přípravek nemá lék definici v zákoně. Všechna léčiva (léčivé látky a léčivé přípravky) jsou potenciálními léky, kterými se stávají v okamžiku, kdy jsou správným způsobem podány pacientovi. Proces je vyjádřen tzv. zákonem o vzniku léku, který říká, že na počátku jsou léčivé látky, které se v průběhu technologických procesů a po smíchání s vhodnými pomocnými látkami stávají léčivými přípravky. Ve vhodném obalu a ve vhodný okamžik podání pacientovi se pak léčivý přípravek stává lékem, který může příznivě ovlivnit zdravotní stav či být použit k diagnostice onemocnění. Zdroj: SNOMED CT: MeSH: nenalezeno ICD10: nenalezeno Úhrada ze zdravotního pojištění Definice: Vláda definuje rozsah péče hrazené z veřejného zdravotního pojištění na základě medicínských kritérií, stupně zdravotního postižení a v rozsahu možností veřejného zdravotního pojištění. Definuje taktéž časovou a místní dostupnost zdravotní péče a uloží plátci tuto dostupnost pro pojištěnce zajistit. Zdroj: /zdravotnictvi/r$\sim$i:wiki:740/ SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno SÚKL Definice: Státní ústav pro kontrolu léčiv je úřad České republiky, organizační složka státu zřízená Ministerstvem zdravotnictví České republiky, jejímž úkolem je dohlížet na to, aby se v České republice používaly pouze jakostní, bezpečné a účinné léky, jakož i funkční a bezpečné zdravotnické pomůcky. Zdroj: SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Antiglaukomatikum Definice: Antiglaukomatikum je léčivo užívané k léčbě zeleného zákalu. Zdroj: /antiglaukomatikum SNOMED CT: MeSH: nenalezeno ICD10: nenalezeno Sémantická interoperabilita v biomedicíně a zdravotnictví
64 58 Veselá Flórová Z. et al. Léčba glaukomu za 1 Kč denně sen nebo realita? Reference [1] data dostupná z z [2] http.// data dostupná pod čísly Správních rozhodnutí [3] Výborný P., Sičáková S., Dohnalová P., Feřtek M., Doležal T.: Terapie glaukomu aktuální přehled dat a informací. Čes. a Slov. Oftal. 69, 2013, 3: [4] Sémantická interoperabilita v biomedicíně a zdravotnictví
65 Vlasáková M. et al. Telemonitoring základních terapeutických prvků léčby diabetes mellitus Telemonitoring základních terapeutických prvků léčby diabetes mellitus a možnosti jejich hodnocení Martina Vlasáková 1, Miroslav Mužný 1,2, Jan Mužík lékařská fakulta Univerzity Karlovy, Praha, Česká republika 2 Fakulta biomedicínského inženýrství Českého vysokého učení technického, Kladno, Česká republika 3 Centrum podpory aplikačních výstupů a spin-of firem Děkanátu 1. lékařské fakulty Univerzity Karlovy, Praha, Česká republika Kontakt: Martina Vlasáková 1. lékařská fakulta Univerzity Karlovy v Praze Adresa: Kateřinská 32, Praha 2 E mail: m.oulicka@gmail.com Cíle výzkumu Hlavním cílem výzkumu je zefektivnění péče o diabetické pacienty s využitím moderních technologií, jejichž použití umožní zlepšení metabolické kontroly nemoci a zvýšení kvality života pacientů. Tohoto cíle bude dosaženo prostřednictvím vývoje telemedicínského systému (Obrázek 1), který integruje tři hlavní technologie: moderní aplikaci pro chytré mobilní telefony zaznamenávající řadu parametrů týkajících se především příjmu potravy a dávek inzulínu či jiných antidiabetik, aktivity tracker pro snímání a hodnocení fyzické aktivity pacienta a glukometr umožňující online přenos naměřených hodnot. Součástí systému je internetový server zaznamenávající a vyhodnocující tato pacientská data, jež do něj budou automaticky přenesena chytrým telefonem v reálném čase. Pro kontrolu glykémie umožňuje telemedicínský systém navíc synchronizaci dat z kontinuálního monitorovacího systému. Dalším možným prvkem systému jsou i inteligentní hodinky, do kterých lze nahrát aplikaci, která komunikuje s aplikací v mobilním telefonu a umožňuje uživateli obousměrné sdílení dat. Současný stav poznání Diabetes mellitus souhrnně označuje chronické onemocnění metabolismu, které postihuje zejména sacharidy. Při kompenzaci onemocnění se uplatňuje řada faktorů. Těmi nejvýznamnějšími jsou množství přijímaných sacharidů, dávka inzulínu a míra fyzické aktivity [1]. Tyto parametry lze kontrolovat pomocí dostupných technických prostředků. Problémem však bývá vyhodnocení těchto veličin pro jejich velké množství a nesourodost. Obtížné je zároveň dostatečně motivovat pacienty dané veličiny měřit (bolestivost, časová nebo technická náročnost, nízká edukace, nedostatečná motivace, nízký komfort). Přitom kvalitní data a hlavně jejich včasné vyhodnocení jsou základem úspěšné kompenzace nemoci. Při kompenzaci diabetu je stále více využívanějším nástrojem telemonitoring. S pomocí telemonitoringu získávají lékaři přesná a spolehlivá data v reálném čase [2]. Vzdálená monitorace ovlivňuje postoje a chování pacientů a potenciálně tak zlepšuje jejich zdravotní stav [3]. Telemonitoring má pro pacienty motivační a vzdělávací efekt a lékaři umožňuje rychlejší vyhodnocení výsledků léčby. Telemedicínský systém přináší zvýšení kvality zdravotní péče a zároveň snižuje potřebu využívat zdravotních služeb, pozitivně tak ovlivňuje výši vynakládaných finančních prostředků na léčbu. Stabilizovaný stav pacienta má kladný vliv na jeho celkovou spokojenost a životní úroveň. Telemonitoring je založen na komunikaci odesílatele s příjemcem v reálném čase, kdy je umožněna okamžitá reakce zdravotníka na podnět pacienta [4]. Pacient využívá pro kontrolu biologických parametrů interaktivní zařízení, které pomocí internetu přenáší data k lékaři. Ten je vyhodnocuje a volí další postup. Uplatnění v biomedicíně a zdravotnictví Navržené technické řešení pro online sběr dat a centralizaci sledovaných parametrů pro jednotlivé diabetické pacienty poskytne jim i jejich lékařům přehlednější a utříděný záznam sledovaných veličin. Systém umožní zaznamenávat téměř v reálném čase trendy ve vývoji hladiny glykémie a zároveň pozorovat míru závislosti vývoje hladiny glykémie na míře fyzické aktivity. Součástí telemedicínského systému je předzpracování, utřídění dat Sémantická interoperabilita v biomedicíně a zdravotnictví
66 60 Vlasáková M. et al. Telemonitoring základních terapeutických prvků léčby diabetes mellitus... Obrázek 1: Návrh telemedicínského systému. a možnost provedení statistického porovnání naměřených hodnot. Přínosem pro pacienta je poskytnutí přímé zpětné vazby odrážející vliv jeho aktuálního životního stylu na průběh nemoci. Pacient zároveň získá lepší kontrolu nad svým onemocněním, která potenciálně zvyšuje motivaci dodržovat stanovenou terapii. Lékaři systém umožní bezprostřední kontrolu kompenzace onemocnění u pacienta s možností včasné úpravy nastavené léčby. Navržené řešení přispěje ke snížení vzniku negativních vlivů špatně kompenzovaného onemocnění (vznik hypoglykémie v důsledku nízké hladiny glykémie a komorbidit v důsledku špatné kompenzace vysoké hladiny glukózy v krvi). Využití telemedicínského systému tak potenciálně může vést ke snížení nákladů vynakládaných na léčbu pacienta a zvýšení jeho kvality života. Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Diabetes Mellitus Definice: Skupina metabolických chorob, které se projevují u pacienta vysokou hladinou krevního cukru. Vzniká v důsledku nedostatku inzulinu, jeho nedostatečného účinku, nebo kombinací obojího. Synonyma: Cukrovka, Úplavice cukrová Zdroj: Velký lékařský slovník. slovniky.cz (přístup ) Sémantická interoperabilita v biomedicíně a zdravotnictví
67 Vlasáková M. et al. Telemonitoring základních terapeutických prvků léčby diabetes mellitus SNOMED CT: MeSH: D ICD10: E10-E14 Telemedicína Definice: Poskytování zdravotnických služeb prostřednictvím vzdálených telekomunikací (zahrnuje interaktivní poradenství a diagnostické služby). Synonyma: ehealth, mhealth, Telehealth Zdroj: National Library of Medicine Medical Subject Headings. (přístup ) SNOMED CT: MeSH: D ICD10: nenalezeno Mobilní aplikace Definice: Počítačové programy nebo software nainstalovány do mobilních elektronických zařízení, která podporují širokou škálu funkcí a použití, které zahrnují televizi, telefon, video, hudbu, zpracování textu, a internetových služeb. Synonyma: Mobile Apps,Portable Electronic Applications Zdroj: National Library of Medicine Medical Subject Headings. (přístup ) SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Kontinuální měření glykémie Definice: Označuje způsob měření krevního cukru (glykémie) v krátkých intervalech (5 minut) v průběhu jednoho a více dní pomocí speciálního senzoru umístěného v podkoží. Údaje se přenášejí bud přímo na displej, nebo po přenosu dat do počítače. Synonyma: Ambulatory continuous glucose monitoring of interstitial tissue fluid Zdroj: Edelsberger T. Encyklopedie pro diabetiky, 1st ed. Praha: Maxdorf; SNOMED CT: MeSH: nenalezeno ICD10: nenalezeno Glykémie Definice: Koncentrace hladiny glukózy v krvi. Je udržována v poměrně stálém rozmezí, protože přísun cukrů je důležitý pro řadu orgánů, zejm. mozek. Pokles pod dolní hranici normy se nazývá hypoglykemie a zvýšená hladina se označuje jako hyperglykemie. Synonyma: Blood Sugar Zdroj: Velký lékařský slovník. slovniky.cz (přístup ) SNOMED CT: MeSH: D ICD10: R73 Reference [1] Jaana, M. Home telemonitoring of patients with diabetes: a systematic assessment of observed effects. Journal of Evaluation in Clinical Practice 2006; (13): (accessed 10. December 2012). [2] Mignerat M, Lapointe L, Vedel I. Using telecare for diabetic patients: A mixed systematic review. Health Policy and Technology. 2014;3(2): [3] Glasgow R.E.. D net diabetes self management program: long-term implematation, outcomes, and generatization results. Preventive medicine 2003; (36): (accessed 10. December 2012). [4] Stone R.A. The Diabetes Telemonitoring Study Extension: an exploratory randomized comparison of alternative interventions to maintain glycemic control after withdrawal of diabetes home telemonitoring. Journal of the American Medical Informatics Association 2012; (66): (accessed 5. December 2012). Sémantická interoperabilita v biomedicíně a zdravotnictví
68 62 Vondrušková L. Výhody využití virtuálního pacienta v nelékařských zdravotnických oborech Výhody využití virtuálního pacienta v nelékařských zdravotnických oborech Lenka Vondrušková 1 1 Neurochirurgická klinika JIP, Fakultní nemocnice Plzeň, Česká republika Kontakt: Lenka Vondrušková Neurochirurgická klinika JIP, Fakultní nemocnice Plzeň, Česká Republika Adresa: Dr. E. Beneše 13, Plzeň E mail: lenkavondruskova@seznam.cz Cíle výzkumu Virtuální pacient (VP) je pojem, který je nejednoznačně chápán. Někteří si pod ním představují uměle vytvořený sofistikovaný model napodobující pacienta, jiní jej chápou jako počítačový software. Asociace amerických lékařských fakult definuje VP jako specifický typ počítačového programu, který simuluje reálné klinické scénáře, vede studenty v roli poskytovatele zdravotní péče při získávání anamnézy, následném klinickém vyšetření a při stanovení diagnózy a léčebného plánu. [1] Cook a Triola popisují VP jako klinické scénáře, které jsou přehrávány na počítačové obrazovce. Studenti hodnotí pacienta typováním nebo výběrem nabízejících se odpovědí s možností doplnění např. výsledků laboratorních testů. Počítač studentům nabízí odpovědi či doplňující informace o zdravotním stavu pacienta. Od studentů se očekává nastavení diagnózy a léčebný plán. VP by měl být určen a využíván k podpoře klinických rozhodovacích dovedností. [2] Dle Hursta je účelem VP vzdělávání studentů a zdravotnických profesionálů prostřednictvím počítačů, které simulují reálnou situaci ze zdravotnického prostředí s využitím virtuálního instruktora a zprostředkováním zpětné vazby. [3] Cílem výzkumu je tedy vytvoření počítačových klinických scénářů pro nelékařské zdravotnické pracovníky a následné testování efektivity těchto scénářů ve vzdělávání. Současný stav poznání Dá se předpokládat, že pokud je virtuální klinický scénář obrazem reálné klinické situace a reálného výběru diagnostických a terapeutických kroků, může být VP užitečnou podpůrnou pomůckou pro testování znalostí a při rozhodování. Stevens upozorňuje, že budoucnost využívání VP závisí na vývoji a hodnoticích metodách, které povedou ke zvýšení využití virtuálních klinických scénářů. [4] Výhodou virtuálních klinických scénářů je mimo jiné snížení rizik na rozdíl od reálného pacienta. Tímto tématem se zabývali autoři jako Eagles, který upozorňoval na nevýhodnost reálného pacienta, [5] nebo Zary, který se zmínil, že u VP je na rozdíl od reálného pacienta chybování povoleno. [6] O výhodnosti VP ve spojení se snížením rizik vůči reálným pacientům pojednávají i Gordon a Stevens. [7, 4] Pro zajištění kvality vytvořeného VP lze využít standardů International Organization for Standardization (ISO). [8, 9] Kvalitou se zabývá i společnost The European Committee for Standardization (CEN). [10] Rozvojem a podporou technologických standardů se zabývá nezisková mezinárodní skupina MedBuiquitous. Je třeba promyslet tvorbu nových forem VP a využití stávajících podpůrných vzdělávacích programů s přihlédnutím k úspoře finančních nákladů. Uplatnění v biomedicíně a zdravotnictví Zájem o rozvoj podpůrných vzdělávacích opor pro zdravotnické profesionály a možnost využití virtuálních klinických scénářů v nelékařských zdravotnických oborech souvisí se strategickými dokumenty ehealth. (Akční plán ehealth, i2010 Evropská informační společnost pro růst a zaměstnanost, Akční plán ehealth (ehap) ). Zájem je patrný i ze strany Ministerstva zdravotnictví ČR (MZ ČR) v projektu Prohlubování a zvyšování úrovně odborných znalostí (lékařů a nelékařů). Nelékařští zdravotničtí pracovníci mají ze zákona ustanovenu povinnost se vzdělávat dle ustanovení 67 zákona č. 96/2004 Sb., o podmínkách získávání a uznávání způsobilosti k výkonu nelékařských zdravotnických povolání a k výkonu činností souvisejících s poskytováním zdravotní péče a o změně některých souvisejících zákonů Sémantická interoperabilita v biomedicíně a zdravotnictví
69 Vondrušková L. Výhody využití virtuálního pacienta v nelékařských zdravotnických oborech 63 (zákon o nelékařských zdravotnických povoláních) ve znění pozdějších předpisů. S tím souvisí dvě otázky. Může VP snížit fluktuaci zaměstnanců ve zdravotnictví? Může pomoci k rychlejšímu zaškolení nových zaměstnanců ve zdravotnictví? Poděkování Tato práce byla podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Virtuální pacient Definice: Interaktivní počítačová simulace reálného klinického scénáře pro účely medicínského tréninku, edukace nebo vyšetření. Zdroj: Ellaway, R., Candler, C., Greene, P., Smothers, V., An Architectural Model formedbiquitous VPs. MedBiquitous, Baltimore, MD SNOMED CT: nenalezeno MeSH: nenalezeno ICD10: nenalezeno Vzdělávání Definice: Komplexní pojem vyjadřující, za jakých podmínek vedou určité vstupy vzdělávacích procesů k určitým výstupům. Vstupy představují faktory dané charakteristikami subjektů a obsahu vzdělávání, podmínky jsou vytvářeny charakteristikami procesů výuky a výstupy jsou vzdělávací výsledky a efekty vzdělávání. Měření a vyhodnocování efektivnosti vzdělávání v praxi je složité, i když výzkum v této oblasti je intenzivně rozvíjen. Zdroj: Kolář, Z. a kol. Výkladový slovník z pedagogiky. Praha: Grada, ISBN: p. 179 SNOMED CT: MeSH: Q ICD10: Z71.9 Simulace Definice: Napodobení jednotlivých dějů nebo chování celého systému. Synonyma: Simulování Zdroj: Němeček, M. a kol. Stručný slovník didaktické techniky a učebních pomůcek. Praha: Státní pedagogické nakladatelství, 1985, p. 82 SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Klinický Definice: Týkající se kliniky. Protikladem může být teoretický (chirurgie je k. oborem medicíny, anatomie oborem teoretickým) nebo ambulantní (k. a ambulantní část nemocnice). Zdroj: Vokurka, M., Hugo, J. a kol. Praktický slovník medicíny. Praha: Maxdorf, 2011, str. 234 SNOMED CT: MeSH: D ICD10: Z006 Riziko Definice: Pravděpodobnost vzniku nepříznivé události, např. vzniku onemocnění. Riziko se zjišt uje statistickými, resp. epidemiologickými metodami, například dlouhodobým sledováním výskytu určitého onemocnění ve vybrané skupině osob, na určitém území, v závislosti na různých okolnostech apod. Zdroj: Vokurka, M., Hugo, J. a kol. Praktický slovník medicíny. Praha: Maxdorf, 2011, str. 403 SNOMED CT: MeSH: D ICD10: nenalezeno Reference [1] Association of American Medical Colleges, Effective Use of Educational Technology in Medical Education: Summary Report of the 2006 AMC Colloquium on Educational Technology. AMC, Washington DC [2] Cook, D.A., Triola, M.M., VPs: a critical literature review and proposed next steps. Medical Education 43, 303e311 [3] Hurst, M.H., Marks-Maran, D. Using a virtual patient aktivity to teach nurse prescribing. Nurse Education in Practice 2011; 11: [4] Stevens, A., Hernandez, J., Johnsen, K., Dickerson, R., Raij, A., Harrison, C., DiPietro, M., Allen, B., Ferdig, R., Foti, S., Jackson, J., Shin, M., Cendan, J., Watson, R., Duerson, M., Lok, B., Cohen, M., Wagner, P., Lind, D.S., The use of VPs to teach medical students history taking and communication skills. American Journal of Surgery 191, 806e811 [5] Eagles, J., Calder, S., Nicoll, K., Sclare, P.D., Using simulated patients in education about alcohol misuse. Academic Medicine 76 (4), 395 Sémantická interoperabilita v biomedicíně a zdravotnictví
70 64 Vondrušková L. Výhody využití virtuálního pacienta v nelékařských zdravotnických oborech [6] Zary, N., Johnson, G., Boberg, J., Fors, U., Development, implementation and pilot evaluation of a web-based VP case simulation environment e web-sp. BioMed Central Medical Education 6,10. At. articlerender.fcgi?tool-pubmed&pubmedid (accessed ) [7] Gordon, J.A., Wilkerson, W.M., Schafer, D.W., Armstrong, E.G., Practicing medicine without risk: students and educators responses to high-fidelity patient simulation. Academic Medicine 76 (5), 469e472 [8] ISO/IEC Information technology Learning, education and training Quality management, assurance and metrics: Part 1: General approach. Switzerland: ISO/IEC 2005 [9] ISO/IEC Information technology Learning, education and training Quality management, assurance and metrics: Part 3: Reference methods and metrics. Switzerland: ISO copyright office, 2009 [10] CEN/ISSS CWA 14644: Quality Assurance and Guidelines. Brussels: CEN/ISSS, 2003 Sémantická interoperabilita v biomedicíně a zdravotnictví
71 Zvára K. a kol. Předzpracování lékařských zpráv pro extrakci informací 65 Předzpracování lékařských zpráv pro extrakci informací Karel Zvára 1, Marie Tomečková 2, Vojtěch Svátek 3, Jana Zvárová 1 1 Ústav hygieny a epidemiologie, 1. lékařská fakulta UK, Praha, ČR 2 EuroMISE Mentor Association, Praha, ČR 3 Katedra informačního a znalostního inženýrství, Fakulta informatiky a statistiky, VŠE Praha, ČR Kontakt: Karel Zvára Ústav hygieny a epidemiologie, 1. lékařská fakulta UK Adresa: Studničkova 7, Praha 2, ČR E mail: karel@zvara.cz Cíle výzkumu Extrakce informací z lékařských zpráv je důležitým krokem pro kvalitní a efektivní rozhodování ve zdravotnictví. Hlavním výzkumným cílem je vyvinout metodu pro přípravu lékařských zpráv pro extrakci informací z volného textu do strukturované formy. Strukturovaná informace může být dále uložena v systémech pro elektronický zdravotní záznam. Současný stav poznání Pro získání plně použitelné klinické informace z lékařských zpráv je zapotřebí takovou informaci uchovávat v plně strukturované formě. Mnoho vědců se již zabývalo problémem získání strukturované formy z volných textů. Je zřejmé, že proces získávání strukturované informace z volného textu nezávisí jen na jazyku [1], ale také na místních požadavcích (vč. legislativních) a na tom, jaká osoba dokumentaci pořizuje. Nejednoznačnost výrazů zdůraznil článek [2], když citováním dalších zdrojů uvedl, že polovině běžně užívaných zkratek v oboru ušní, nosní a krční chirurgie nerozumí více než 90 % začínajících lékařů z jiných oborů. V minulosti se podařilo dosáhnout určitých úspěchů při extrahování numerických údajů [3] (např. hodnot krevního tlaku). Aplikace v biomedicíně a zdravotnictví Strukturovanou informaci získanou z lékařských zpráv lze uložit v elektronickém zdravotním záznamu a dále ji využít pro rozhodování při poskytování péče. Strukturovaná informace by měla představovat nějaký druh užitečného extraktu, jako např. pacientského souhrnu ep- SOS [4]. Základním očekávaným užitečným účelem je poskytnutí přístupu k údajům např. o pacientově anamnéze, preskripci pro poskytování přeshraniční péče. Dalším využitím může být měření efektivity a kvality zdravotní péče či využití pro on-line nápovědu a upozorňování při poskytování péče. Byl vyvinut systém pro zpracování lékařských zpráv, který je přístupný pomocí webového prohlížeče a který funguje následujícím způsobem. V první fázi uživatel (lékař) zvolí klinickou část lékařské zprávy, aby byly odstraněny údaje, které vůbec zpracovávány být nemají. Tato část je automatizovaně tokenizována a připravena pro druhou fázi zpracování. Cílem druhé fáze je standardizovat vstupní lékařskou zprávu. Obsahuje několik nástrojů pro úpravu textu. Výsledná standardizovaná zpráva by neměla obsahovat zkrácená slova, může obsahovat v klinické praxi běžně užívané zkratky, a nesmí obsahovat ani překlepy ani jiné druhy chyb při psaní. Ukončení druhé fáze umožní uživateli pokračovat do třetí fáze zpracování. Cílem třetí fáze je identifikace a označení slovníkových termínů. Uživatel vyhledává a označuje nalezené termíny identifikátory jednotlivých podporovaných klasifikačních systémů. Podporovanými klasifikačními systémy jsou SNOMED CT, LOINC, MKN10 a databáze léků a léčivých přípravků SÚKL. Poděkování Práce byla částečně podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Zpráva Definice: Podrobný výčet nebo tvrzení nebo formální záznam dat pořízený na základě skutečnosti. Zdroj: cgi SNOMED CT: Sémantická interoperabilita v biomedicíně a zdravotnictví
72 66 Zvára K. a kol. Předzpracování lékařských zpráv pro extrakci informací MeSH: D ICD10: nenalezeno Legislativa Definice: Práce sestávající z textu navržené či platné legislativy ve formě výnosů, zákonů, vyhlášek, nařízení či dalších druhů právních předpisů. Zdroj: cgi SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Kvalita péče Definice: Úroveň, která charakterizuje zdravotnictví nebo poskytované zdravotní služby založená na přijatých standardech kvality. Zdroj: cgi SNOMED CT: MeSH: D ICD10: nenalezeno Reference [1] Garcia-Remesal M., Maojo V., Billhardt H., Crespo J., Integration of Relational and Textual Biomedical Sources, Methods Inf Med 2009;48(1):76-83 [2] Tsung O. Cheng, Letters to Editor; in: Medical Abbreviations Journal of the Royal Society of Medicine, 97 (11), 2004: 556 [3] Semecký J., Zvárová J.(supervisor), Multimedia electronic health record in cardiology. Diploma thesis, Faculty of Mathematics and Physics of Charles University in Prague, 2001 (in Czech) [4] Smart Open Services for European Patients, D3.2.2 Final definition of functional service requirements Patient Summary, (last access ) Sémantická interoperabilita v biomedicíně a zdravotnictví
73 Živicová V. a kol. Stroma dlaždicobuněčných nádorů hlavy a krku 67 Stroma dlaždicobuněčných nádorů hlavy a krku Veronika Živicová 1,2, Zdeněk Fík 1,2, Barbora Dvořánková 2, Karel Smetana Jr. 2 1 Anatomický ústav 1.LF UK, Prague, Czech Republic 2 Klinika ORL a chirurgie hlavy a krku 1.LF UK a FN Motol, Prague, Czech Republic Kontakt: Veronika Živicová Anatomický ústav 1.LF UK, Prague Adresa: U Nemocnice 3, Prague 2 E mail: Veronika.Zivicova@lf1.cuni.cz Cíle výzkumu Mezi nádory hlavy a krku dominují dlaždicobuněčné karcinomy (90%), vycházející ze sliznic horních dýchacích a polykacích cest, nejčastěji dutiny ústní, orofaryngu, hypofaryngu a hrtanu dlaždicobuněčné karcinomy hlavy a krku (HNSCC head and neck squamous cell carcinoma) [2, 7]. Podpůrnou složkou maligně transformovaných epitelů je stroma sestávající z extracelulární matrix (ECM), nádorově asociovaných fibroblastů, myofibroblastů a dalších buněk (pericyty, hladké svalové buňky, adipocyty, makrofágy, mastocyty, lymfocyty) [9]. Myofibroblast od fibroblastu odlišuje přítomnost kontraktilních mikrofilament. Za spolehlivou kombinaci znaků identifikujících myofibroblast jsou považovány hladký svalový aktin (SMA), P4H, vimentin a absence cytokeratinů. Myofibroblasty negativně ovlivňují průběh chronického zánětu. V nádorech, kde vznikají z nádorově asociovaných fibroblastů (CAFs), indukují progresi onemocnění [12]. Tato podobnost je zahrnuta v tezi Harolda Dvoraka o nádoru jako ráně, která se nehojí [5]. Původ CAFs není dosud objasněn. Zvažuje se vznik z lokálních mezenchymových buněk, z mezenchymové kmenové buňky kostní dřeně a do třetice z nádorové buňky cestou epitelo-mezenchymové transformace [4]. Další významnou složkou nádorového stromatu je fibronektin, podílející se na proliferaci fibroblastů, stimulaci chemotaxe imunokompetentních buněk, stimulaci produkce proteáz atd. [11]. V dlaždicobuněčném karcinomu dutiny ústní je přítomnost fibronektinu asociována s přítomností uzlinových metastáz a tudíž celkovou horší prognózou pro pacienta [8, 3]. V extracelulární matrix HNSCC lze detekovat také tenascin. Tenascin zahrnuje rodinu glykoproteinů, ze které je nejlépe prozkoumán tenascin-c. Tenascin-C hraje důležitou roli jak ve fyziologických, tak patologických procesech. Ve zvýšené míře byl nalezen nejen v HNSCC, ale také v karcinomech kolorekta, prsu, močového měchýře, plic, prostaty a v gliomu. Jedna jeho podjednotka (FN III) je schopná vázat fibronektin. [10] Tenascin spolu s glykosaminoglykany jsou v současnosti detailně zkoumány pro svou roli v progresi nádorových onemocnění a jako objekty možné cílené léčby [6, 1]. Přítomnost tenascinu a jeho vliv na chování nádoru se hodnotí i v naší laboratoři. Tento projekt studuje stroma za in vivo a in vitro podmínek a porovnává je s klinickým průběhem. Vzorky HNSCC byly odebrány peroperačně na ORL klinice na základě informovaného souhlasu od 54 pacientů. Byly zpracovány technikou zmrazených řezů s následnou přípravou histologického preparátu. Tenascin byl detekován v téměř 80% případů. Jako kontrola byla použita zdravá bukální sliznice. Dle našich výsledků se tenascin nachází ve zdravé tkáni pouze v bazální vrstvě, zatímco v nádorech je v celé šíři epitelu. Na základě dispenzarizace pacientů byla vytvořena Kaplan-Meierova analýza přežití. Analýza ukázala, že pacienti s pozitivitou tenascinu žijí kratší dobu. Zjištěná závislost však nebyla statisticky významná. Dále byly ze 4 nádorových a 3 zdravých tkání získány primární fibroblasty. Fibroblasty byly kultivovány jednak za standardních podmínek, jednak za stimulace TGFb-1. V in vitro kultivaci zdravých fibroblastů za standardních podmínek po dobu 7 dní se tenascin nenachází. Stimulované kultury jsou tenascin pozitivní. Nádorově asociované fibroblasty jsou naproti tomu heterogenní a na stimulaci neodpovídají v pozitivním ani negativním smyslu. V produkci extracelulární matrix jsou velmi různorodé. Tato heterogenita může být podkladem rozdílného chování nádorů pozorovaného u pacientů. Experimenty potvrzují důležitou roli stromatu v biologii nádorů hlavy a krku. Jeho komponenty jako fibronektin nebo tenascin ovlivňují růst a šíření nádoru. Z tohoto důvodu je nutné bližší poznání jeho jednotlivých složek. Tyto molekuly mají velký klinický význam, protože mohou sloužit jako vhodné nové cíle protinádorové terapie. Současný stav poznání Dlaždicobuněčné nádory hlavy a krku sestávají z nádorových buněk a nádorového stromatu. Nádorové stroma je podpůrná tkáň, která obsahuje extracelulární Sémantická interoperabilita v biomedicíně a zdravotnictví
74 68 Živicová V. a kol. Stroma dlaždicobuněčných nádorů hlavy a krku matrix, nádorově asociované fibroblasty a další buněčné typy [9]. I když nové léčebné modality míří specificky proti nádorové buňce, dlaždicobuněčné nádory hlavy a krku často recidivují a metastazují. Příčina by mohla být v nádorovém stromatu a jeho složkách, jako je fibronektin nebo tenascin [11, 1]. Aplikace v biomedicíně a zdravotnictví Složky extracelulární matrix hrají významnou roli v nádorové biologii. Glykoproteiny extracelulární matrix ovlivňují nádorový růst a šíření. Proto by tyto molekuly mohly být použity jako nové cíle protinádorové terapie. Poděkování Práce byla částečně podpořena projektem SVV Univerzity Karlovy v Praze. Kĺıčová slova Karcinom Definice: Maligní epitelová neoplázie Zdroj: nenalezeno SNOMED CT: MeSH: D ICD10: nenalezeno Extracelulární matrix Definice: Sítovitá struktura nalezena v extracelulárním prostoru a ve spojení s bazální membránou povrchu buňky. Podporuje buněčnou proliferaci a podporuje adhezi jak buněčných struktur, tak lyzátu v kultuře. Zdroj: Kreis & Vale, Guidebook to the Extracellular Matrix and Adhesion Proteins, 1993, p93 SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Tenascin Definice: Hexametrický glykoprotein extracelulární matrix přechodně exprimovaný v mnoha vyvíjejících se orgánech a často re-exprimovaný v nádorech. Je přítomný v centrálním a periferním nervovém systému, tak jako v hladkém svalu a šlachách. Zdroj: nenalezeno SNOMED CT: nenalezeno MeSH: D ICD10: nenalezeno Reference [1] Afratis N, Gialeli C, Nikitovic D, Tsegenidis T, Karousou E, Theocharis AD, Pavao MS, Tzanakakis GN, Karamanos NK. Glycosaminoglycans: key players in cancer cell biology and treatment. FEBS J. 2012; 279(7): [2] Argiris A, Karamouzis MV, Raben D, Ferris RL. Head and neck cancer. Lancet. 2008; 371(9625): [3] de Bondt RB, Nelemans PJ, Hofman PA, Casselman JW, Kremer B, van Engelshoven JM, Beets-Tan RG. Detection of lymph node metastases in head and neck cancer: a meta-analysis comparing US, USgFNAC, CT and MR imaging. Eur J Radiol. 2007; 64(2): [4] De Wever O, Demetter P, Mareel M, Bracke M. Stromal myofibroblasts are drivers of invasive cancer growth. Int J Cancer. 2008; 123(10): [5] Dvorak HF. Tumors: wounds that do not heal. Similarities between tumor stroma generation and wound healing. N Engl J Med. 1986; 315(26): [6] Guttery DS, Shaw JA, Lloyd K, Pringle JH, Walker RA. Expression of tenascin-c and its isoforms in the breast. Cancer Metastasis Rev. 2010;29(4): [7] Licitra L, Felip E, Group EGW. Squamous cell carcinoma of the head and neck: ESMO clinical recommendations for diagnosis, treatment and follow-up. Ann Oncol. 2009; 20 Suppl 4: [8] Lyons AJ, Bateman AC, Spedding A, Primrose JN, Mandel U. Oncofetal fibronectin and oral squamous cell carcinoma. Br J Oral Maxillofac Surg. 2001; 39(6): [9] Polyak K, Haviv I, Campbell IG. Co-evolution of tumor cells and their microenvironment. Trends Genet. 2009; 25(1):30-8. [10] Pas J, Wyszko E, Rolle K, Rychlewski L, Nowak S, Zukiel R, Barciszewski J. Analysis of structure and function of tenascin-c Int J Biochem Cell Biol. 2006;38(9): [11] Ritzenthaler JD, Han S, Roman J. Stimulation of lung carcinoma cell growth by fibronectin-integrin signalling. Mol Biosyst. 2008; 4(12): [12] Van Buerden HE, Von den Hoff JW, Torensma R, Maltha JC, Kuijpers-Jagtman AM. Myofibroblasts in palatal wound healing: prospects for the reduction of wound contraction after cleft palate repair. J Dens Res. 2005;84(10): Sémantická interoperabilita v biomedicíně a zdravotnictví
75 Part II English Semantic Interoperability in Biomedicine and Healthcare Část II Anglicky
76
77 1 Contents 3 5 The Follow-up Management of Thyroid Disorders During the Pregnancy Bartáková J., Jiskra J. 6 9 Safety of Private Data in Big Data and Biomedicine Berger J., Beyr K Role of Single Nucleotide Polymorphisms in the Pathogenesis of High-grade Gliomas Bielniková H., Buzrla P., Bielnik O., Tomanová R., Urbanovská I., Hrušková L., Dvořáčková J., Mazura I On Gene Conversion Properties Gergelits V Mutation Detection of Collagen Type I Genes Hrušková L Statistical Methods for Constructing Gestational Age-Related Charts for Fetal Size and Pregnancy Dating using Longitudinal Data Hynek M., Long J.D., Stejskal D., Zvárová J Significance of Cerebral Folate Deficiency for Development and Progression of Autism Krsička D., Šárek M Integration of Various Lifestyle and Diabetes Devices Within a Diabetes Self-management Application Mužný M., Vlasáková M., Mužík J., Arsand E Matching Medical Websites to Medical Guidelines through Clinical Vocabularies Rak D., Svátek V International Communication Protocols for Interoperability in the Czech Republic Seidl L., Hanzĺıček P Big Data in Hospital Information Systems in the terms of Security Schlenker A., Reimer M Secondary Cataract in Patients after Implantation of Multifocal IOLs Sičová K., Výborný P., Pašta J DNA in Biomedical Applications Slovák D., Zvárová J Unstructured Data in Evidence-based Healthcare Stonová M Conduction System Development in Mouse Šaňková B., Beneš J., Sedmera D Presence of Nasal Microbiota and Their Influence on Development of Chronic Rhinosinusitis Šteffl M., Plzák J Glaucoma Treatment for 1 CZK per Day Dream or Reality? Veselá Flórová Z., Výborný P., Sičáková S., Obenberger J Telemonitoring of the Basic Therapeutic Elements of the Diabetes Mellitus Treatment and Their Evaluation Vlasáková M., Mužný M., Mužík J Advantages of Virtual Patient in Paramedical fields of the Health Care Services Vondrušková L Preprocessing of Narrative Medical Reports for Information Extraction Zvára K., Tomečková M., Svátek V., Zvárová J Stroma of Head and Neck Squamous Cell Carcinoma Živicová V., Fík Z., Dvořánková B., Smetana Jr. K. Semantic Interoperability in Biomedicine and Healthcare
78
79 Bartáková J., Jiskra J. The Follow-up Management of Thyroid Disorders During the Pregnancy 3 The Follow-up Management of Thyroid Disorders During the Pregnancy Jana Bartáková 1,2, Jan Jiskra 1 1 Institute of Biophysics and Informatics, First Faculty of Medicine, Charles University in Prague, Prague, Czech Republic 2 Third Department of Medicine, General University Hospital and First Faculty of Medicine, Charles University in Prague, Prague, Czech Republic Correspondence to: Jana Bartáková Institute of Biophysics and Informatics, First Faculty of Medicine, Charles University in Prague Address: Salmovská 478/1, , Prague 2 E mail: bartakovaj@gmail.com Aims of Research Our primary aim is to determine if the thyroid checkups among pregnant women on levothyroxine (LT4) treatment during gestation in Czech Republic are in the line with the recommendation of the recent guidelines from the American Thyroid Association (ATA) 2011 or Endocrine Society (ES) The secondary aim included evaluation of the possibilities to reduce costs by modification of thyroid laboratory utilization in clinical practice. State of the Art About 10-15% of pregnant women are positive for autoantibodies to thyroid peroxidase (TPOAb) [1, 2, 3] and up to 5% have elevated thyroid stimulating hormone (TSH) [4, 5]. The negative impact of untreated thyroid dysfunction on fertility, course of pregnancy and postpartum period and development of offspring has been well described [5, 6, 7, 8, 9]. However, up to date studies focusing on an appropriate follow-up management of pregnant women with thyroid disorders in clinical practice are lacking. In 2011 and 2012 two guidelines from the ATA and the ES for the management of thyroid disease in pregnancy were published [10, 11]. Both guidelines contain recommendations for the initiation of LT4 treatment and the frequency of thyroid check-ups once treatment is started. There is a high degree of consistency between the guidelines: thyroid function should be tested by TSH every 4-6 weeks in the first trimester of pregnancy. During second and third trimesters the ES recommends to continue testing every 4-6 weeks while the ATA suggests checking TSH level twice during these period of pregnancy (once during the second and once during the third trimester). What s more, not only guidelines recommendations can slightly vary but also the endocrinology practice can vary. In 2013, clinical members of the ES, the ATA, and the AACE (American Association of Clinical Endocrinologists) were asked to fill in a web based survey consisting of 30 questions that dealt with testing, treatment and modulating factors in the management of hypothyroidism. Among 821 respondents, 67.7% would check thyroid laboratory studies every four weeks during pregnancy, 21.4% every eight weeks, 7.9% every 12 weeks, and 2.9% every 2 weeks [12]. In our study from the years , 188 pregnant women treated with LT4 were followed and examined during their pregnancy according to the recommended algorithm by ATA The thyroid check-up in third trimester (26th-32th gestational week) was evaluated as redundant in case of uncomplicated hypothyroidism and/or positive TPOAb and producing inadequate high costs versus low likelihood of benefit. As we can see, even the thyroid management during pregnancy is in principle straightforward, it can t be the case of clinical practice. Therefore, the thyroid laboratory utilization during pregnancy should be more study. Application in Biomedicine and Healthcare The inappropriate laboratory utilization is widely prevalent and costly for healthcare system [13, 14, 15, 16]. Hence the potentially redundant thyroid tests could be readily modifiable and highly effective component of management of pregnant women with thyroid disorders. This can be made throughout the study of necessity of the recommended thyroid check-up frequency, the real clinical practice of the repeat testing as well as the real investigated hormones in endocrinology practice. Semantic Interoperability in Biomedicine and Healthcare
80 4 Bartáková J., Jiskra J. The Follow-up Management of Thyroid Disorders During the Pregnancy Acknowledgements Antibodies to Thyroid Peroxidase This paper has been partially supported by the SVV project of Charles University in Prague. Keywords Thyroid Disorder Definition: Any benign or malignant condition that affects the structure or function of the thyroid gland. Synonyms: Disorder of thyroid gland, Disease of thyroid gland, Thyroid disease, Disorder of thyroid Reference: The Free Dictionary [online] [cit ]. Available from: medical-dictionary.thefreedictionary.com/ SNOMED CT: MeSH: C ICD10: E00-E07 Pregnancy Definition: The period from conception to birth. Synonyms: Gestation, Gestational period, Pregnant State Reference: The Free Dictionary [online] [cit ]. Available from: medical-dictionary.thefreedictionary.com/ SNOMED CT: MeSH: G ICD10: Z33 Thyroid Stimulatory Hormone Definition: A hormone that is secreted by the anterior lobe of the pituitary gland and stimulates the thyroid gland. Synonyms: Thyroid Stimulating Hormone, Thyroid Stimulation Hormone, TSH, Thyrotrophin, Thyrotropin, Thyrotropic hormone Reference: Merriam Webster: An Encyclopedia Britannica Company [online] [cit ]. Available from: com/ SNOMED CT: MeSH: D ; D ICD10: Y42.8 Definition: Antibodies targeted against thyroid peroxidase, an enzyme normally found in the thyroid gland, plays an important role in the production of thyroid hormones. Synonyms: Antithyroperoxidase antibody, Thyroid peroxidase antibody, TPO antibodies, Thyroperoxidase antibodies, anti-thyroid peroxidase antibodies, anti- TPO antibodies Reference: Clinique health [online] [cit ]. Available from: cliquehealth.org/index.php?option=com_ zoo&task=item&item_id=1505&itemid=4 SNOMED CT: MeSH: not found ICD10: Y42.8 Levothyroxine Definition: Thyroid hormone prepared synthetically; used as the sodium salt in the treatment of hypothyroidism and the treatment and prophylaxis of goiter and thyroid carcinoma. Synonyms: Levothyroxine sodium, Thyroxine sodium, Thyroxine, L-Thyroxine, L-Thyrox, Levo-T, Sodium Levothyroxine Reference: The Free Dictionary [online] [cit ]. Available from: medical-dictionary.thefreedictionary.com/ SNOMED CT: MeSH: D ; D ICD10: Y42.1 References [1] Springer D, Zima T, Limanova Z. Reference intervals in evaluation of maternal thyroid function during the first trimester of pregnancy. European journal of endocrinology / European Federation of Endocrine Societies. 2009;160(5): [2] Lazarus JH, Kokandi A. Thyroid disease in relation to pregnancy: a decade of change. Clinical endocrinology. 2000;53(3): [3] Glinoer D. The regulation of thyroid function in pregnancy: pathways of endocrine adaptation from physiology to pathology. Endocrine reviews. 1997;18(3): [4] Potlukova E, Potluka O, Jiskra J, Limanova Z, Telicka Z, Bartakova J, et al. Is age a risk factor for hypothyroidism in pregnancy? An analysis of 5223 pregnant women. The Journal of clinical endocrinology and metabolism. 2012;97(6): [5] Allan WC, Haddow JE, Palomaki GE, Williams JR, Mitchell ML, Hermos RJ, et al. Maternal thyroid deficiency and pregnancy complications: implications for population screening. Journal of medical screening. 2000;7(3): Semantic Interoperability in Biomedicine and Healthcare
81 Bartáková J., Jiskra J. The Follow-up Management of Thyroid Disorders During the Pregnancy 5 [6] Lazarus JH. Thyroid function in pregnancy. British medical bulletin. 2011;97: [7] Krassas GE, Poppe K, Glinoer D. Thyroid function and human reproductive health. Endocrine reviews. 2010;31(5): [8] Casey BM, Dashe JS, Wells CE, McIntire DD, Leveno KJ, Cunningham FG. Subclinical hyperthyroidism and pregnancy outcomes. Obstetrics and gynecology. 2006;107(2 Pt 1): [9] Benhadi N, Wiersinga WM, Reitsma JB, Vrijkotte TG, Bonsel GJ. Higher maternal TSH levels in pregnancy are associated with increased risk for miscarriage, fetal or neonatal death. European journal of endocrinology / European Federation of Endocrine Societies. 2009;160(6): [10] Stagnaro-Green A, Abalovich M, Alexander E, Azizi F, Mestman J, Negro R, et al. Guidelines of the American Thyroid Association for the diagnosis and management of thyroid disease during pregnancy and postpartum. Thyroid : official journal of the American Thyroid Association. 2011;21(10): [11] Lazarus J, Brown RS, Daumerie C, Hubalewska-Dydejczyk A, Negro R, Vaidya B European thyroid association guidelines for the management of subclinical hypothyroidism in pregnancy and in children. European thyroid journal. 2014;3(2): [12] Burch HB, Burman KD, Cooper DS, Hennessey JV. A 2013 survey of clinical practice patterns in the management of primary hypothyroidism. The Journal of clinical endocrinology and metabolism. 2014;99(6): [13] Leese B. Is there too much laboratory testing? Reprt 79. York, Great Britain: University of York. 1991:29pp. [14] Beck JR. Does feedback reduce inappropriate test ordering? Archives of pathology & laboratory medicine. 1993;117(1):33-4. [15] Bareford D, Hayling A. Inappropriate use of laboratory services: long term combined approach to modify request patterns. BMJ (Clinical research ed). 1990;301(6764): [16] van Walraven C, Raymond M. Population-based study of repeat laboratory testing. Clinical chemistry. 2003;49(12): Semantic Interoperability in Biomedicine and Healthcare
82 6 Berger J., Beyr K. Safety of Private Data in Big Data and Biomedicine Safety of Private Data in Big Data and Biomedicine Jiří Berger 1, Karel Beyr 1 Institute of Pathological Physiology, Prague, Czech Republic Correspondence to: Jiří Berger Institute of Pathological Physiology Address: U Nemocnice 5, Prague 2 E mail: jiri.berger@e-fractal.cz Aims of Research Big Data have a great potential for research in biomedicine in many areas Analysis of patient segmentation, treatment price and result helps determine the medically and economically most efficient course of treatment for a given patient Proactive identification of patients who would benefit from preventive health care Analysis of disease incidence can provide epidemiological findings and suggest preventive measures Assisting in detecting and minimizing fraud attempts in health care Cooperation with pharmaceutical companies, so that it will be easier for them to identify group of relevant patients for clinical trials (assuming the patients prior consent) Nowadays, the trend of digitalization of medical and related documents marks a time for engagement of technology called Big Data for biomedical informatics. This technology provides faster and more efficient processing and sharing of huge amount of data. Since health care involves sensitive data, the main concern is a protection of patients private data. Many countries are implementing computerization of health care. For example, in the USA a Health Information Technology for Economic and Clinical Health Act, (HITECH) is being employed. The aim of this research is to design and define the rules that prevent the abuse and fraud concerning sensitive biomedical data, but which would not limit its efficiency and quality of output data at the same time. State of the Art The larger the quantity of heterogeneous biomedical data grouped in Big Data so that they contain as complex data set as possible, the higher benefit will they have for future processing of various analyses based on health documentation of whole population and concerning biomedical information. Once such a project starts and as authors of this article assume, it is not going to be a technological, but rather an organizationally ethical problem the most effective means of processing such a large amount of data will be to provide it to the professional public as a source of research. It is quite common abroad when a project is fully or even only partially funded from public resources then the conditions are set so that the information is available for non-commercial activities with minimal limitations. In spite of the fact that it will never be possible to fully disclose biomedical information (with regard to sensitivity of stored data), there still exists a large array of uses, implementations and applications that would benefit from having access to it. Due to the use of population data, there exists a risk of indirect identification of patients information. The slightest sign of abuse brings ethical problems and may even stop the entire research. To prevent possible issues with privacy, it is necessary to enforce very strong and efficient rules that facilitate maximum data yield, together with a strict conservation of anonymity and protection of private data. It is necessary to limit data mining so that it would not be possible to abuse or disclose sensitive data by any, even theoretical, means. Abroad, a relevant legislative is already in place, e.g. the current version of Health Insurance Portability and Accountability Act (HIPAA) in the USA specifies the standards concerning healthcare records transactions. Similarly, the EU legislation called Data Protection Directive 95/46/EC defines the necessity of patient consent concerning processing of his private data and portability of medical data. However, EU still does not have a unified approach to the protection of private data [1]. Semantic Interoperability in Biomedicine and Healthcare
83 Berger J., Beyr K. Safety of Private Data in Big Data and Biomedicine 7 Application in Biomedicine and Healthcare The usage of Big Data in biomedicine and healthcare will always have its specifics. The amount of anonymization used on data will always be inversely proportional to the quality of output data [2]. It means, that one of the key elements of successfully using Big Data will be setting of the ratio between anonymization and the quality of mined data. Basic anonymization would be required for efficient usage. By basic anonymization we consider removal of (or in any way denying access to) private information like name and national identification number and their replacement with anonymous identifier which would identify subject across the data set. Unfortunately, data altered in such a way will still be vulnerable. Therefore it is necessary to prevent various types of possible privacy attacks. For example, a query returning prescribed medicaments and their dosage for concrete patient contains sensitive data. From the knowledge of medicine prescribed, it is possible to infer patient diagnosis. If the private data (name, national identification number) are anonymized, then we can assume that returned data will not contain sensitive information. On the other hand there exists a plethora of queries that do not return sensitive data. For example: Query about the amount of practitioner s patients, query about prescribed medicine in certain region, or query about specific diagnosis across the population. Securing the whole database One possibility to increase security in biomedicine and health care is to encrypt the underlying data. It adds another safety layer and thus decreases the risk of sensitive data leak or abuse [3]. There are various advanced algorithms [4] which can encrypt medical records so that only personnel with relevant authorization can decode them. Those algorithms have advantages over classical encrypting methods (symmetrical and asymmetrical ciphers) they are faster and cheaper than traditional RSA concept, and they provide better security in case of stolen password. Authors of [5] describe querying of medical data encrypted using these algorithms. Their findings are perfectly suitable for Big Data concept. As encryption will inevitably bring slower querying, it should not be recommended for the whole data set, but only for structured patient data. Indirect disclosure of sensitive data from partially anonymized database If there are completely non-anonymized data, or data with basic anonymization in which the base patient data (name, national identification number) were replaced, it is necessary to manage access restrictions. In such cases, it is often possible to gain specific patient data, or at least data which can be inferred with a high degree of probability. For aforementioned reasons, it is necessary to employ a solution that can limit queries, combination of which can reveal sensitive data, or only enable those combinations to personnel with higher access rights while ensuring feedback control and risk analysis of searched queries and their results. Another query which can lead to sensitive data breach is the one that returns significantly small set of result entities. Queries can contain combination of various factors. However, if a query is over combined, it can, in extreme case, lead to a scenario in which only one patient is in the result set. Even if the patient s name is not stored in database, it can sometimes be inferred. For example, if we know a fraction of health record of a given person, then using relevant information (age, sex and address) we can indirectly gain his sensitive information. This risk can be eliminated to some extent by employing heuristic rules and their gradual improvement. Those rules would block answers that could contain risky set of information. Indirect disclosure of sensitive data from fully anonymized database In case of anonymized data set, full access to database can be provided under specified conditions. Before the medical records are saved to a database, it is possible (or sometimes even required by relevant legislation) to anonymize the records (remove name and national identification number) and also generalize them. We call this process full anonymization. By generalization we mean making identification a person by quasi-identifiers (eg. date of birth, address, sex) difficult or impossible. By matching quasi-identifiers, medical records the governor of Massachusetts were leaked using quasi-identifiers that were accessible in anonymized mode and matched with electoral data containing quasi-identifiers that were published together with names. Author of [6] describe generalization algorithm as a principle that patients form groups based on their quasiidentifiers, and each group must contain at least K patients. This approach makes it difficult to identify people, but in some cases identification is still possible in contrary to K-anonymity. Authors of [7] improve K-anonymization by proposing improvement, L-anonymization. It requires patients in the same quasi-identifier group to have heterogeneous sensitive data. Another approach to generalization lies in rounding quasi-identifiers. Data can be stored in database in more forms, each time with different level of precision. The Semantic Interoperability in Biomedicine and Healthcare
84 8 Berger J., Beyr K. Safety of Private Data in Big Data and Biomedicine higher authorization level of the personnel reading data, the more precise quasi-identifiers can be accessed. For example, instead of a birth date, only a birth year or a decade is stored. Instead of a whole address, only a city or region name is stored. Another possibility of generalization lies in not storing certain quasi-identifiers at all. ICD codes (International Statistical Classification of Diseases and Related Health Problems), are used abroad. They are maintained by WHO. These codes have hierarchical structure, therefore they are perfectly suitable for generalization. Authors of [8] specify probability of patient identification based on frequency of rare ICD codes. They recommend a removal of 5% to 25% of the rarest codes, and their replacement by more generic ones. This leads to significantly lower probability of patient identification with relatively low precision lost. Non-triviality of querying A big problem concerning research on Big Data in biomedicine informatics concerns the creation of queries. It is not expected that a majority of researches in biomedical field would be able and willing to design their own Map/Reduce parallel algorithms to solve queries in Big Data medical database. It is more probable that there will be a cooperation from IT technicians, analysts and programmers who will create tools that could be parametrized, run on demand etc. Both issues (safety and non-triviality) could be solved by a query tool. The tool would contain query templates, programs and algorithms that could be parametrized via user interface. The Big Data database could then be simply queried by such a tool without complex training. We advocate using templates primarily as a means of simplification for broad research community and to increase availability of relevant research and its results for wide range of applications. The question of security would also be settled. Template examples: Prescription of concrete active substance according to medical specialization Frequency analysis according to place of residence Demographic composition of patients Volumes of medical actions of a facility by period Correlation between diseases and patient s type of profession Multilayer architecture can be built for this need. It will be an extension of classical Big Data technologies in specific biomedical implementation. It will be split at least into those layers: 1. Professional public will be granted permission to use only prepared templates into which it would be possible to insert custom parameters, but it would not be possible to change the nature of a query. Query could utilize only one template, it would not be possible to combine templates. This way it is guaranteed that no sensitive data could leak. This access will be primarily for postgraduate students for their basic research. 2. Specialized workplaces would be allowed to combine templates and will have greater freedom in their parametrization. A set of heuristic rules will oversee the queries and will report or even block the combinations that could lead to a disclosure of sensitive information. 3. Team of analysts with security credentials will prepare templates including heuristic rules that will watch over their usage. Under standard security checks they could also perform Big Data queries. This practice could be used in cases where there will be a probability of work with sensitive data. As part of their workload, they could handle complex tasks and queries according to requests of individual workplaces in cases when it would not be efficient to use classic templates or when there would be a risk of leak of sensitive data. Resulting data would be checked and possibly anonymized before their return to requesting workplace. 4. Narrow specialized team of auditors will define and configure advanced heuristic rules and approve templates before release. 5. The last level could be based on a system with elements of artificial intelligence. It would be based on advanced pattern recognition algorithms, neural networks and learning process. It could automatically scan and detect unhandled possibilities of data abuse in real time. Discussion Research will continue in three main fields. Firstly, it will be aimed on standard safety rules and relevant security technologies and their utilization in biomedical data. Their specifics and deviations from standard approach in data security methods will be defined. This part will concentrate specifically on analysis of encryption algorithms with regard to granted permissions, their benefits and disadvantages and also their influence on efficient data analysis. Second research area will focus on anonymization algorithms and their influence on data yield and efficiency of processing. It will define the principles and the influence of anonymization on biomedical data with regard to theoretical possibilities of retrieving sensitive data using Semantic Interoperability in Biomedicine and Healthcare
85 Berger J., Beyr K. Safety of Private Data in Big Data and Biomedicine 9 various query combinations. This area will not only be focused on theoretical field, but it will also try to generalize results received by combinatorial methods from representative sample of anonymized data and to compare them with real data and evaluate their similarity. The third and largest area is to define an interface between low-level Big Data querying mechanism and query templates, where the main objective will be a balance of safety mechanisms and usability for wide professional public. Target state would be to find an interface which would be comparable in usability to MS Excel or MS Access, or their alternatives. This area would elaborate on distribution of rights and responsibilities among four defined roles, their detailed description and process mapping of their relation to data security. Each role will be analyzed for potential risks and threats including relevant countermeasures. Basic analysis of heuristic functions and elements of artificial intelligence as means of improving safety of biomedical data will be performed. Acknowledgements This paper has been partially supported by the SVV project of Charles University in Prague. Keywords Personal Data Definition: Any information relating to an identified or identifiable natural person. Synonyms: Personally identifiable information Reference: art. 2 let. a) Directive n. 95/46/ES on the protection of individuals with regard to the processing of personal data and on the free movement of such data SNOMED CT: not found MeSH: not found ICD10: not found Big Data Definition: Big data is a set of techniques and technologies that require new forms of integration to uncover large hidden values from large datasets that are diverse, complex, and of a massive scale. Synonyms: Computer cloud, multi-node database Reference: [6] SNOMED CT: not found MeSH: not found ICD10: not found Anonymization Definition: Process of either encrypting or removing personally identifiable information from data sets, so that the people whom the data describe remain anonymous. Synonyms: Information sanitization Reference: [6] SNOMED CT: not found MeSH: not found ICD10: not found References [1] Boussi Rahmouni H, Solomonides T, Casassa Mont M, Shiu S. Modelling and Enforcing Privacy for Medical Data Disclosure across Europe. In Adlassnig KP, editor. Medical Informatics in a United and Healthy Europe Proceedings of. Sarajevo: IOS Press; p [2] Duncan et al. Disclosure Risk vs. Data Utility: The R-U Confidentiality map: Los Alamos National Library; [3] Amazon Web Services. Creating Healthcare Data Applications to Promote HIPAA and HITECH Compliance [4] Alshehri, Radziszowski, Raj. Designing a Secure Cloud-Based EHR System using Ciphertext-Policy Attribute-Based Encryption. [5] Narayan S, Gagné M, Reihaneh SN. Privacy preserving EHR system using attribute-based infrastructure. [6] Sweeney L. k-anonymity: a model for protecting privacy. International Journal on Uncertainty. 2002; 10(5): p [7] Machanavajjhala A, Kifer D, Gehrke J, Venkitasubramaniam M. L-diversity: Privacy beyond k-anonymity. ACM Transactions on Knowledge Discovery from Data March; 1(1). [8] Vinterbo S, L OM, S D. Hiding information by cell suppression. In Proc AMIA Symp; p Semantic Interoperability in Biomedicine and Healthcare
86 10 Bielniková H. et al. Role of Single Nucleotide Polymorphisms in the Pathogenesis of High-grade Gliomas Role of Single Nucleotide Polymorphisms in the Pathogenesis of High-grade Gliomas Hana Bielniková 1,2, Petr Buzrla 1, Ondřej Bielnik 3, Radoslava Tomanová 1, Irena Urbanovská 4, Lucie Hrušková 2, Jana Dvořáčková 1, Ivan Mazura 2 1 The Institute of pathology, University Hospital Ostrava, Ostrava, Czech Republic 2 First Faculty of Medicine Charles University Prague, Prague, Czech Republic 3 Neurosurgery clinic, University Hospital Ostrava, Ostrava, Czech Republic 4 CGB laboratory Ostrava a.s., Ostrava, Czech Republic Correspondence to: Hana Bielniková The Institute of pathology, University Hospital Ostrava Address: 17. listopadu 1790, 70852, Ostrava-Poruba E mail: hana.bielnikova@ .cz Aims of Research Single nucleotide polymorphisms (SNPs) are single nucleotide variations in the sequence of deoxyribonucleic acid (DNA) between two individuals. This is one of the most common genetic changes in coding and noncoding regions of human genome [1]. The effects of these changes are reflected depending on the location of polymorphisms in DNA. If SNPs located in noncoding regions, their influence on the organism is usually negligible and usually does not lead to phenotypic abnormalities. In the presence of polymorphisms in coding regions, their potential impact on the phenotype is determined by a number of conditions. The aim of my work is the isolation of DNA from tumor tissue of patients with diagnosed astrocytoma or glioblastoma and subsequent analysis of selected genes using molecular-genetic methods. The obtained phenotypic, clinical and genetic data will be assessed for their possible correlation. State of the Art Gliomas are the most common primary brain tumors in adults. The prognosis of these tumors, depending on their degree, is very poor. In malignant types such as anaplastic astrocytoma (AA, grade III.) and glioblastoma (GBM, Grade IV.) the time of survival is in the range of 3 to 5 years for AA and 15 to 16 months in GBM [2]. The risk of these tumors is their infiltrative growth in the brain tissue impeding their surgical removal, high proliferative activity, nuclear atypia, presence of angiogenesis and necrosis [3]. The gold standard for the diagnosis of gliomas is histological examination, which, however, is complicated by significant heterogeneity of tumors and overlapping morphological characteristics, particularly at higher degrees. For this reason, in recent years, we have been using findings from the field of genetics in the diagnosis and treatment of gliomas. Using cytogenetic and molecular-genetic methods have been discovered a number of alterations of chromosomes and genes which play a significant role in the typing of tumors or are important predictive and prognostic factors [4]. A number of genetic changes, which occur in gliomas, are very broad. These modifications both at the level of whole chromosomes and their parts (aneuploidy, deletions, duplications, translocations, etc.) and at the level of DNA strand (point mutations, deletions, insertions, amplifications, substitutions, epigenetic changes- methylation, acetylation, etc.). Most of these alterations concerns areas in which there are important tumor suppressor genes or protooncogens [5, 6]. In recent years, many studies have been focused on the connections between genetic polymorphisms and the development of cancer. One of the discussed polymorphism, also in gliomas, is SNP309 (rs ) in the promoter region of MDM2. In this case polymorphism SNP309 increased binding affinity of the transcriptional activator Sp1 to the DNA and thereby increases the expression of the MDM2 gene [7]. MDM2 gene product is a protein regulating p53 pathway, one of the most important tumor suppressor factors. MDM2 protein as a controller directly binds to p53 and adversely affects its stability and activity. It has been shown that even a slight change in the level of MDM2 significantly influences the suppressor function of p53 and for some types of tumors overexpression of the Semantic Interoperability in Biomedicine and Healthcare
87 Bielniková H. et al. Role of Single Nucleotide Polymorphisms in the Pathogenesis of High-grade Gliomas 11 gene is associated with progression of disease and a weaker response to therapy [8]. SNPs in coding regions of DNA may also act negatively. In some situations a base change in the codon may cause exchange of one amino acid for another. A negative consequence of these substitutions may be a defective or non-functional protein, or the formation of stop codon, the result is the creation of a truncated protein product, often dysfunctional. Application in Biomedicine and Healthcare Most of polymorphisms have not a direct impact on human health. The localization of these changes within the nucleic acid sequence is substantial. In some cases their presence can alter the effectiveness of drugs, affect the response of the organism to exposure to harmful substances or be associated with the emergence and development of certain diseases. Tracking the connection between polymorphisms and gliomas may bring new knowledge about the origin and development of these tumors, where some of the investigated SNPs can serve as potential prognostic and diagnostic indicators. Acknowledgements The present study was supported by the project SVV of Charles University in Prague. Keywords Deoxyribonucleic Acid Definition: A double-stranded polynucleotide consisting of two single chains deoxyribonucleotide units. Serves as a carrier of genetic information. Synonyms: DNA Reference: Alberts B, et al. Essential Cell Biology. Espero Publishing SNOMED CT: MeSH: D ICD10: not found Glioma Definition: Tumor of CNS arising from nerve tissue supporting neuroglia, glia. These include astrocytoma, glioblastoma, etc. Gliomas grow in different parts of the brain. They cause epilepsy, mental changes, increase in intracranial pressure, headaches and impaired vision, bearing signs, etc. They exist in malignant and benign variant. Synonyms: Glial cells tumor Reference: gliom SNOMED CT: MeSH: D ICD10: not found Single Nucleotide Polymorphism Definition: Polymorphism of DNA sequence given by variability of only in one base- substitution in one nucleotide of DNA, this substitution must be extended in the population. Synonyms: Polymorphism, SNP Reference: SNOMED CT: not found MeSH: D ICD10: not found Genetic Mutation Definition: Changing heritable genetic information in the DNA related to genes or whole chromosome. According to the site which is affected it may or may not affect the function of cells and organisms. Arises spontaneously, or are caused by external factors - mutagens of chemical, physical or biological factors. Synonyms: Mutation Reference: mutace SNOMED CT: MeSH: D ICD10: not found Phenotype Definition: The observable appearance or property of an individual, as a result of his genotype hereditary dispositions and environmental effects. Synonyms: Reference: fenotyp SNOMED CT: MeSH: D ICD10: not found Semantic Interoperability in Biomedicine and Healthcare
88 12 Bielniková H. et al. Role of Single Nucleotide Polymorphisms in the Pathogenesis of High-grade Gliomas References [1] Clark DP., Molecular biology: Understanding the Genetic Revolution. Elsevier Academic Press, [2] Karajannis MA, Zagzag D., editors. Molecular pathology of nervous system tumors. New York, Springer, [3] Iacob G, Dinca EB. Current data and strategy in glioblastoma multiforme. J Med Lif Agu;2(4): [4] Nikiforova MN, Hamilton RL. Molecular diagnostics of gliomas. Arch Pathol Lab Med May;135: [5] Hersh DS, Mehta RI, et al.the Molecular Pathology of Primary Brain Tumors. Path C Rev Sept;18(5): [6] Duncan ChG, Yan H. Genomic alterations and the pathogenesis of glioblastoma. Cell Cycle Apr;10(8): [7] Wan Y, Wu W, Yin Z, Guan P, Zhou B. MDM2 SNP309, genegene interaction, and tumor susceptibility: an updated metaanalysis. BMC Can.2011;11(208):1-9. [8] Bond GL, Levine AJ. A single nucleotide polymorphism in the p53 pathway interacts with gender, environmental stresses and tumor genetics to influence cancer in humans. Onc 2007;26: Semantic Interoperability in Biomedicine and Healthcare
89 Gergelits V. On Gene Conversion Properties 13 On Gene Conversion Properties Václav Gergelits 1,2 1 Institute of Molecular Genetics of the AS CR, Prague, Czech Republic 2 First Faculty of Medicine, Charles University, Prague, Czech Republic Correspondence to: Václav Gergelits Institute of Molecular Genetics of the AS CR, v.v.i. Address: Vídeňská 1083, Prague 4 E mail: vaclav.gergelits@img.cas.cz Aims of Research Meiotic recombination of homologous chromosomes is essential for increasing the intraspecious and interspecious genetic diversity and for the proper segregation of chromosomes to gametes. The process of meiotic recombination starts in the meiotic prophase I, when enzyme SPO11 programatically forms DNA double-strand breaks (DSBs). On one hand the DSB formation is essential for the genetic diversity enhancement, on the other hand all the DSBs have to be repaired for the cell survival. The repair of a particular DSB starts by a release of one strand of DNA, which searches for a sufficiently similar segment in a chromatid of the homologous chromosome. Alternatively, the DSB could be repaired by a sister chromatid. However, in mammals this possibility is only hypothetical on autosomes so far. The recombination and DSB repair occurs after succesfull localization of a homologous segment. There are two possible results of the recombination. The chromatid arms are either exchanged crossover (CO), or not exchanged noncrossover (NCO). In both cases, gene conversion, a one-directional transfer of genetic information from the donor chromatid to the acceptor one, occurs. The NCO is generally less understood than CO. The detection of gene conversion is a good way how to show the places in genome where the NCO have occured. This could lead to better understanding of mechanisms of NCO and gene conversion. Research interest in gene conversion is motivated by its roles in evolution and genome dynamics, human pathogenesis as well as its value in exploring mechanistic models of recombination. [1] In my doctoral project I am interested in possibilities of detection of NCO gene conversion events. To this aim the mouse model is used. The aim is to detect and characterize elements of gene conversion in a whole-chromosome scale and subsequently infer the mechanisms by which the gene conversion occurs. The subject of this paper is to summarize the basic properties of gene conversion and NCO in human and in mammals as well as to show their relevance to human diseases. State of the Art The sites of CO do not occur randomly in genome. They rather cluster in recombination hotspots, sites where their occurence is much more probable. The length of those sites is on order of kilobases. In mammals, the recombination hotspots are determined almost exlusively by Prdm9 gene. Every allelic form of Prdm9 determines its binding sites the sites in genome, where a DSB can occur. Recently, it has been shown that NCOs take place in the same hotspots as COs [2]. A variety of studies has provided estimates of gene conversion lengths based on different types of data. The segments of gene conversion occuring during NCO are generally shorter than those occuring during CO. The NCO gene conversion length was estimated to span bp [5]. Recently, two studies referred a detection of NCO gene conversion with tract lengths 86 ± 49 bp [4] and bp [2]. The CO gene conversion tracts were directly detected for the first time by tetrad analysis and its length was referred as 626 ± 319 bp and 566 ± 277 bp, respectively for two different hotspots [4]. In spite of the importance of NCOs, the frequency at which they occur in mammals remains widely uncharacterized. Number of DSB occuring in meiosis suggests that NCO occurs in 90% of cases, while CO occurs only in 10% of cases. However, the ratio between NCO and CO widely varies in different hotspots. Ratios as different as NCO:CO 15:1 and 1:1 were observed in two different hotspots studied by Cole and colleagues [4]. The mechanism of conversion could be inferred by its quantitative properties. The classical Szostak s model [6] assumed that in mammals both CO and NCO are happening by double Hollyday s Junction resolution. However, recently, the study performed by Cole and colleagues [4] strongly indicates, that in case of NCO, there is rather a different mechanism, e.g. Synthesis-dependent strand annealing (SDSA). The gene conversion events together with CO contribute to the evolution of genome. Gene conversion copies a short (tens to hundreds of bases) segment of DNA from Semantic Interoperability in Biomedicine and Healthcare
90 14 Gergelits V. On Gene Conversion Properties the donor chromatid to the recipient homologous chromatid. The original segment of DNA of the recipient chromatid is replaced by the segment of donor chromatid, while the donor chromatid remains unchanged. There are multiple ways how gene conversion contributes to genome evolution. I will provide three examples: 1. The gene conversion causes GC bias. The onedirectional transfer of polymorphism is more common for bases G and C than for bases A and T. It is thought that this GC bias may be an adaptation to the high rate of methyl-cytosine deamination which can subsequently lead to transitions of C to T. 2. Gene conversion is a major player in the centromere evolution, where the rate of CO is generally much lower than in other parts of genome [7]. 3. The gene conversion plays an important role in so called hotspot paradox. The question is how can recombination hotspots, determined in-trans by Prdm9 gene, exist? Being recombination hotspots, they are more prone to DSB creation, which are repaired by process leading to gene conversion. The DSB repair leads to the modification of binding site, which can no longer be a binding site. Recently, the study by Cole and colleagues [4] provided a partial explanation for this paradox. It was shown that the erosion of binding sites occurs only in 20% of gene conversions during NCO, while only the surroundings of the binding sites are changed in the rest of the cases. Application in Biomedicine and Healthcare NCO and gene conversion are processes, which occur frequently during meiosis, an essential process of all sexually reproducing organisms. NCO thus closely relates to patogenesis in human. Gene conversion has been implicated in at least 18 human diseases, e.g. Campomelic dysplasia, Hypergonadotrophic hypogonadism, Hurler-Scheie syndrome [1]. Based on our unpublished data we assume that gene coversion could be related to mechanisms of hybrid sterility. Acknowledgements This paper has been partially supported by the SVV project of Charles University in Prague. Keywords Gene Conversion Definition: Gene conversion is a process whereby a DNA sequence is copied from one segment of the genome (donor) to another (recipient), resulting in the replacement, insertion, or deletion of a DNA sequence in the recipient. Reference: [3] SNOMED CT: not found MeSH: D ICD10: not found Homologous Recombination Definition: The process by which segments of DNA are exchanged between two DNA duplexes that share high sequence similarity. Reference: [1] SNOMED CT: not found MeSH: D ICD10: not found Double-Strand Break Definition: Breaks in opposite DNA strands that lie within 10-20bp of each other. Synonyms: DSB Reference: [1] SNOMED CT: not found MeSH: D ICD10: not found References [1] Chen, J. M., Cooper, D. N., Chuzhanova, N., Férec, C., & Patrinos, G. P. (2007). Gene conversion: mechanisms, evolution and human disease. Nature Reviews Genetics, 8(10), [2] Williams, A. L., Genovese, G., Dyer, T., Altemose, N., Truax, K., Jun, G.,... & Przeworski, M. (2015). Non-crossover gene conversions show strong GC bias and unexpected clustering in humans. elife, 4, e [3] Assis, R., & Kondrashov, A. S. (2012). A strong deletion bias in nonallelic gene conversion. PLoS Genet, 8(2), e e [4] Cole, F., Baudat, F., Grey, C., Keeney, S., de Massy, B., & Jasin, M. (2014). Mouse tetrad analysis provides insights into recombination mechanisms and hotspot evolutionary dynamics. Nature genetics, 46(10), [5] Jeffreys, A. J., & May, C. A. (2004). Intense and highly localized gene conversion activity in human meiotic crossover hot spots. Nature genetics, 36(2), [6] Szostak, J. W., Orr-Weaver, T. L., Rothstein, R. J., & Stahl, F. W. (1983). The double-strand-break repair model for recombination. Cell, 33(1), [7] Shi, J., Wolf, S. E., Burke, J. M., Presting, G. G., Ross-Ibarra, J., & Dawe, R. K. (2010). Widespread gene conversion in centromere cores. PLoS Biol, 8(3), e Semantic Interoperability in Biomedicine and Healthcare
91 Hrušková L. Mutation Detection of Collagen Type I Genes 15 Mutation Detection of Collagen Type I Genes Lucie Hrušková 1 1 Department of Pediatrics and Adolescent Medicine, First Faculty of Medicine, Charles University in Prague, Czech Republic Correspondence to: Lucie Hrušková First Faculty of Medicine, Charles University in Prague Address: Kateřinská 32, Prague 2 E mail: black.luca@sezanm.cz Aims of Research Collagen type I is a major structural protein of connective tissue, especially of bones and skin. It is a heterotrimer composed of two copies of alpha1 (I) and one alpha2 (I) chains encoded by COL1A1 and COL1A2 genes. It generates interactions with other molecules of extracellular matrix (cartilage oligomeric protein, integrins decorin, collagen type V, phosphophoryn etc.). Due this interactions collagen type I increases integrity of connective tissue [1, 2]. Aim of this research is assembling of molecular genetic data of patients with defective collagen type I production and the comparison of obtained data with phenotypes of these individuals. This study is focused on analysis of DNA samples (using methods Polymerase chain reaction (PCR) and Sanger sequencing) of patients diagnosed with osteogenesis imperfecta, type I IV. State of the Art Genetic changes of collagen type I result either in production of defective molecules of the protein or in decreased gene product activity. Mutations of COL1A1 genes are associated with phenotypes of osteogenesis imperfecta type I IV, Ehlers-Danlos syndrome (classical type and type VIIA), Caffey disease, and idiopathic osteoporosis [2]. Osteogenesis imperfecta (OI), type I IV, is a heritable bone fragility disorder characterised by short stature, deformed bones, blue or grey colorit of sclera, dentinogenesis imperfecta. It occurs in 1 in births. The severity of OI differs from mild (OI I) to lethal (OI type II) forms. Presence of clinical signs differs not only between individual types of the disease, but also in cohort of patients of the same form of OI [3]. The first type of OI is in most cases result of STOP codons in COL1A1 gene which causes the premature termination of transcription. Not fully transcripted alpha 1(I) chains are not incorporated into the collagen type I. This leads to reduced production of final proteine. OI types II IV originate in structural changes of COL1A1 and COL1A2 genes. 80% of these forms is caused by glycine substitution (it is the most important amino acid of alpha chains that occurs in 338 Gly-X-Y repetitive motives), 20% are results of splice site mutations. Severity of these mutations increases toward to C-terminus of gene (alpha chains start aligning into the heterotrimer at C-terminus) [3]. The molecule of collagen type I contains three multi ligand binding regions in the molecular in which are highly concentrated interactions with other molecules. Mutations of the first region (MLBR1) usually lead to milder phenotypes (OI types I and IV) whereas structural changes of MLBR2 and MLBR3 caused severe or lethal forms of disorder (OI type II and III) [4]. Application in Biomedicine and Healthcare Molecular genetic analyses of collagen type I genes are crucial for identification of the largest mutational spectrum in Czech patients. Obtained data will be compared with world databases (Online Mendelian Inheritance in Man, Human Genome Mutation Database, Ensembl, GeneCards, etc.). This way we could be able to compare the disease etiology of Czech patients with other populations or ethnics groups. Further, identification of DNA changes and their impact on clinical picture will be helpful for initiating timely and appropriate treatment. This would be also useful for predictive diagnostics in individuals with suspected defects of collagen type I. In other case, if analyses do not detect structural changes of COL1A1 or COL1A2 genes, we can consider possibility of location of causal mutations in other genes associated with collagen type I. Semantic Interoperability in Biomedicine and Healthcare
92 16 Hrušková L. Mutation Detection of Collagen Type I Genes Acknowledgements This paper has been partially supported by the SVV project of Charles University in Prague. Keywords Amino Acid Definition: A peptide; the basic building block of proteins (or polypeptides). Reference: Griffiths AJF et al. An introduction to genetic analysis. Sixth edition. New York, USA: W. H. Freeman and Company; str SNOMED CT: MeSH: D ICD10: not found Deoxyribonucleic Acid Definition: One of two types of molecules that encode genetic information. (The other is RNA. In humans DNA is the genetic material; RNA is transcribed from it. In some other organisms, RNA is the genetic material and, in reverse fashion, the DNA is transcribed from it. Synonyms: DNA Reference: main/art.asp?articlekey=3090 SNOMED CT: MeSH: D ICD10: not found Mutation Definition: A permanent structural alteration in DNA. In most cases, DNA changes have either no effect or cause harm, but occasionally a mutation can improve an organism s chance of surviving, and the beneficial change is passed on to the organism s descendants. Typically, mutations are more rare than polymorphisms in population samples because natural selection recognizes their lower fitness and removes them from the population. Reference: NBK21106/pdf/Bookshelf_NBK21106.pdf SNOMED CT: (ID found for Genetic mutation ) MeSH: D ICD10: not found Nonsense Codon Definition: A codon for which no norma trna exists; the presence of a nonsense codon causes termination of translation (ending of the polypeptide chain). The three nonsense codons are called amber, ocher and opal. Synonyms: STOP codon Reference: Griffiths AJF et al. An introduction to genetic analysis. Sixth edition. New York, USA: W. H. Freeman and Company; str SNOMED CT: not found MeSH: D ICD10: not found Polymerase Chain Reaction Definition: A technique for amplifying a large number of copies of a specific DNA sequence flanked by two oligonucleotide primers. The DNA is alternately heated and cooled in the presence of DNA polymerase ad free nucleotides so that the specified DNA segment is denatured, hybridized with primers, and extended by DNA polymerase. Synonyms: PCR Reference: Carey J, White B. Medical genetic. Third edition. St. Louis, Missouri: Mosby; str. 348 SNOMED CT: MeSH: D ICD10: not found References [1] Barnes MA, Weizhong Ch, Morello R, Cabral WA, Weis M, Eyre DR et al. Deficiency of cartilage-associated protein in recessive lethal osteogenesis imperfecta. N Engl J Med. 2006; 355(26): [2] Fahiminiya S, Majewski J, Mort J, Moffatt P, Glorieux FH, Rauch F. Mutations in WNT1 are a cause of osteogenesis imperfecta. J. Med. Genet. 2013; 50: [3] Forlino A, Cabral WA, Barnes AV, Marini JC New perspectives on osteogenesis imperfecta. Nat Rev Endocrinol. 2011; 7: [4] Sweeney, SM, Orgel JP, Fertala A, McAuliffe JD, Turner KR, Di Lullo GA, Chen S, Antipova O, Perumal S, Ala-Kokko L, Forlino A, Cabral WA, Barnes AM, Marini JC, San Antonio JD. Candidate cell and matrix interaction domains on the collagen fibril, the predominant protein of vertebrates. J Biol Chem. 2008;283: Semantic Interoperability in Biomedicine and Healthcare
93 Hynek M. et al. Statistical Methods for Constructing Gestational Age-Related Charts Statistical Methods for Constructing Gestational Age-Related Charts for Fetal Size and Pregnancy Dating using Longitudinal Data Martin Hynek 1,2, Jeffrey D. Long 3,4, David Stejskal 2, Jana Zvárová 2,5 1 Gennet, Centre for Fetal Medicine and Reproductive Genetics, Prague, Czech Republic 2 Institute of Hygiene and Epidemiology, First Faculty of Medicine, Charles University, Prague, Czech Republic 3 Department of Psychiatry, Carver College of Medicine, University of Iowa, Iowa City, IA, USA 4 Department of Biostatistics, College of Public Health, University of Iowa, Iowa City, IA, USA 5 EuroMISE Centre, Institute of Computer Science AS CR, Prague, Czech Republic Correspondence to: Martin Hynek Gennet, Centre for Fetal Medicine and Reproductive Genetics Address: Kostelní 9, Prague 7 E mail: martin.hynek@gmail.com Introduction The assessment of fetal size and the accurate estimation of gestational age (GA) are of crucial importance for proper pregnancy management. Early detection of fetal growth restriction or macrosomia may decrease associated morbidity and mortality [1, 2]. Precise information on GA may prevent unnecessary obstetric interventions at the time of delivery [3]. The information is almost exclusively based on ultrasound measurements of fetal biometric parameters (e.g. crown-rump length, head circumference, femur length, etc.), which almost invariably increase with GA. The means for evaluating these measurements are age-related reference charts (centile charts) allowing interpretation of obtained fetal measurement in comparison with the expected average measurement in the reference population. A variety of statistical methods for constructing reference charts has been suggested. To allow for elaboration, let y be the fetal measurement of interest, and let t be gestational age. The statistical objective is to estimate the centile, c α (y t), of the conditional distribution of y (given t) for specified values of α (e.g. α = 0.95 for the (100 α) th = 95 th centile). Moreover, c α (y t) is required to be a smooth function of t [4]. There are two main issues in the estimation of c α (y t): approximating the distribution of y t, and smoothing estimated centiles on t. Several approaches have been suggested to tackle these issues, including parametric, semiparametric and nonparametric techniques. Detailed overviews and comparisons of different approaches can be found in the literature [5, 6, 7, 8]. Interest is usually in the construction of two types of reference charts: charts of fetal size and dating charts. The former is used to assess fetal size, whereas the latter to predict GA. It is incorrect to use the size charts to estimate GA; proper dating charts should be constructed [9]. If the charts of fetal size model the fetal size as a function of GA, the dating charts are produced in similar fashion to size charts, except that they are based on modelling GA as a function of fetal dimension using the conditional distribution, t y. An appropriate method for constructing reference charts fulfills certain requirements. Altman and Chitty (1993) state that reference centiles should change smoothly with gestation, and they should provide a good fit to the raw data. It is desirable for the statistical model to be as simple as is compatible with these requirements [9]. The WHO Multicentre Growth Reference Study Group (MGRS) [8] agreed on primary criteria for method selection, which include the ability to: estimate precisely outer centiles, estimate centiles simultaneously in such a way that they are constrained to be ordered (not to cross), estimate z-score and centiles using direct formulae, apply continuous age smoothing, and Semantic Interoperability in Biomedicine and Healthcare
94 18 Hynek M. et al. Statistical Methods for Constructing Gestational Age-Related Charts... account for both skewness and kurtosis when necessary. In addition, the secondary criteria were: the ability to assess fit to the data, ease of explanation and clear documentation, useful for application to different anthropometric measures, so that WHO growth curves would rely on a single approach. The vast majority of literature dealing with fetal reference charts describes statistical methods suitable for cross-sectional data, ie. each fetus contributes only one observation to a reference sample. Because single-visit data is easiest to collect and methodology for computing centiles is straightforward, most published papers in past decades have used cross-sectional datasets to produce reference charts. However, longitudinal data are becoming more common and different techniques must be used for data in which every fetus is measured more than once. Among the challenges, serial measurements of individual fetuses induce correlated data that needs to be accounted for in the statistical modeling. There is also the question of how to compute degrees of freedom (df), especially when the number of repeated measurements varies among the fetuses [9]. The aim of this article is to compile and propose statistical methods for constructing age-related fetal reference charts using longitudinal data. The method will be used to produce reference charts of fetal size and charts for pregnancy dating for the Czech population in a future analysis. The study will be based on a large dataset collected during routine ultrasound scans in the Fetal Medicine Centre Gennet in Prague. Because a considerable proportion of our fetuses are measured more than once during the course of pregnancy, we are focusing on accommodating currently available methods for construction of fetal reference charts to longitudinal data. This article focuses solely on statistical methods. The equally important issues concerning sample size, sample selection, inclusion and exclusion criteria, and data collection, are not discussed here and can be found in the relevant literature [9, 10, 11, 12]. Statistical methods When searching for a suitable statistical method that fulfills the requirements mentioned above, we have to realize two specifics of fetal biometry. First, it is well established that mean fetal dimensions increase monotonically during pregnancy. The between-subject variability of fetal dimensions also tends to increase (spread out over time), which is summarized by the standard deviation (SD) over age. It is crucially important to consider not only the relation between the mean and GA, but also the relation between the SD and GA [9]. Second, we know from many previous studies that the distribution of fetal dimensions is close to normal for any GA [12]. In addition, the mean is a non-linear function of GA for most fetal dimensions, and so too the SD. Therefore, the most used method for construction of fetal reference charts is linear regression using fractional polynomials (FPs)([13]), fitted separately for the mean and the SD, assuming normality at each GA, but non-linearity as a function of GA [4, 13, 14, 15]. First, we will describe the mean and SD method using conventional polynomials (CPs) for the cross-sectional data, then introduce its modification using FPs, and discuss methods for checking the goodness-of-fit. Finally, we will propose an extension of the method to longitudinal data. Cross-sectional data Mean and SD model The original mean and SD approach represents parametric modeling proposed by Altman [14] and Royston and Wright [15]. The method assumes normally distributed fetal measurements at each GA and uses CP regression to model the mean and the SD as a function of GA. A desired centile curve is then constructed with the centile defined as c α = µ + kσ, (1) where k is the corresponding centile of the standard normal distribution and µ and σ are the mean and SD, respectively, at the required GA for the reference population. The original method consists of several steps. First, CP regression is used to describe the mean as a function of GA. The authors suggest starting with a cubic polynomial, and proceed to reduce the number of terms in a top-down manner if the coefficient of the highest term is not significantly different from zero. Once a suitable mean model is selected, a separate analysis is performed to model the variability around the mean. The authors assume that if the variable has a normal distribution at all ages, then the residuals should have a normal distribution and the absolute values of residuals should have the half normal distribution. The mean of the half standard normal distribution equals 2/π. The scaled absolute residuals are the absolute residuals multiplied by π/2. If we regress the scaled absolute residuals on GA, the predicted values from this model give agespecific estimates of the SD of the residuals, and hence of y. Similarly, CP regression is used to estimate the appropriate relationship in the same manner as for the mean. Finally, because SD increases with GA (heteroskedasticity), weighted least-squares regression can be used, with weights being equal to the reciprocal of the square root of the estimated SDs [16]. However, Altman and Chitty report that the effect of the weighting is almost always rather small and CP regression might suffice [9]. Semantic Interoperability in Biomedicine and Healthcare
95 Hynek M. et al. Statistical Methods for Constructing Gestational Age-Related Charts Fractional polynomials CPs, which were used in the original Altman s and Chitty s mean and SD method, suffer from several wellknown limitations. Low order polynomials offer only a few curve shapes, higher order polynomials may fit badly at the extremes, and polynomials do not have asymptotes [13]. Royston and Altman (1994) introduced an extended family of curves known as FPs [13]. FPs are similar to CPs in that their time transformations are power functions, and FPs subsume CPs as a special case. However, the powers in FPs are allowed to be negative numbers and fractions. Possible exponents are usually chosen from a small preselected set of integer and non-integer values: S = { 3, 2, 1, 0.5, 0, 0.5, 1, 2, 3}, where 0 indicates the natural log transformation. The elements in S are the main values of Tukey s ladder of re-expressions, used for general curve-fitting problems [17], but different sets are possible. Attractive features of FPs include parsimony (they provide similar fit as polynomials but with fewer terms), a wide range of curve shapes, and the ability to approximate asymptotes [4, 18]. To fix ideas, consider the equation for the FP of order m, denoted as FPm, with power terms p = (p 1... p m ), m φ (t; p) = β 0 + φ m (t; p) = β j h j (t), (2) j=0 where h 0 (t) = 1 and { t p j if p h j (t) = j p j 1 (3) h j 1 (t) log t if p j = p j 1 for j = 1,..., m, and t 0 log e (t) [4, 13]. A further constraint is t > 0, to ensure the FP transformation will always be defined. For example, a first-order FP (FP1) with p 1 = 0 is β 0 + β 1 log(t). A second-order FP (FP2) with p 1 = 2 and p 2 = 1 is β 0 +β 1 t 2 +β 2 t, and a third-order FP (FP3) with p = (0, 2, 2) is β 0 + β 1 log t + β 2 t 2 + β 3 t 2 log t. FPs with m 2 offer a wide variety of non-linear (and linear) curves. Thus, FP1 or FP2 regression models suffice for many practical applications [4]. FP1 functions are always monotonic, whereas FP2 functions are monotonic or non-monotonic (convex/concave), with the quadratic polynomial being a special case (p 1 = 1, p 2 = 2). Because the biological nature of fetal growth is largely monotonic, it seems sensible that FP1 models would be sufficient for constructing fetal reference charts. However, FP2 function may also have application, especially if development is considered over a relatively wide epoch. Because FP2 curves cover a wider class of trends, usually both FP1 and FP2 are considered when fetal charts are produced. Indeed, previous experience with FPs in fetal charts indicates that FP2 models were the best-fitting in many cases [19, 20, 21]. When using FPs in regression, how do we select the best model(s) among all the possible candidates? We assume throughout that maximum likelihood (ML) estimation is used, with the key sample quantity being 2 times the maximized log-likelihood, known as the deviance. When all the candidate FP models are of the same order (e.g., FP1), then the best model is simply the one with the smallest deviance [4]. However, when dealing with FP models of different order, an alternative strategy is required. The reason is that the deviance will always decrease even when a worthless predictor is added to the model [18]; thus, more complex models would be preferred to less complex ones. To address the issue of inference with models of different order, Royston and Sauerbrei [4] note that under some general assumptions, the deviance difference between a null model with [β 1,..., β m ] T = 0 and a FP model of order m is approximately asymptotically distributed as χ 2 on df = 2m. Similarly, the deviance difference between FPm and FP(m 1) models is distributed approximately as χ 2 on df = 2, under the null hypothesis that the additional β in the FPm model is zero [4]. Thus, the likelihood ratio test (LRT) can be used to compare models. The originally proposed sequential procedure by Royston and Altman [13] had a series of steps, comparing FP2 with FP1 models, then FP1 with the linear model (p 1 = 1), and then finally the linear model with the null model (β 1 = 0). However, this approach can greatly increase type I error probability when t is uninfluential and may sometimes give inconsistent results [4]. Therefore, Royston and Sauerbrei [4] recommend an alternative approach, which is a closed test procedure that preserves type I error probability at a chosen level α (typically α = 0.05). The procedure runs as follows: 1. Test the best FP2 model at the level of α against the null model (all β j>0 = 0) using df = 4. If the test is not significant, stop and conclude that t is a worthless predictor. Otherwise continue. 2. Test the best FP2 model against a linear model (p 1 = 1) using df = 3. If the test is not significant, stop and the final model is the linear model. Otherwise continue. 3. Test the best FP2 model against the best FP1 model using df = 2. If the test is not significant, the final model is FP1; otherwise the final model is FP2. Modeling the mean and SD with FPs is performed in the same way as described above. The only difference is that FPs are used instead of CPs to model the mean and the SD of y t. The evaluation of goodness-of-fit As repeatedly emphasized in the methods literature [6, 8, 9, 12], it is absolutely necessary to assess how well the final models fit the data. Many diagnostic tools have been proposed. Here we present a list of the most frequently mentioned methods, including those recommended by the WHO MGRS Group [8]: Semantic Interoperability in Biomedicine and Healthcare
96 20 Hynek M. et al. Statistical Methods for Constructing Gestational Age-Related Charts... visual inspection of the shape of the centile curves plotted together with data points, empirical and fitted centiles plotted on top of each other, comparison of observed percentages that occur above and below estimated centiles against expected, scatterplot of the distribution of residuals in z- scores, normal Q-Q plot of residuals in z-scores, detrended normal Q-Q plot (worm plot) of residuals in z-scores, i.e., plotting empirical quantiles minus the normal quantiles against the normal quantiles, normality test of residuals in z-scores or their combinations, e.g., the Q-statistic [22] (a combination of tests for the four moments of the distribution, the modified D Agostino tests [23] and Shapiro-Wilk test), smoothed residuals as a function of t plotted as a solid line together with a pointwise 95% confidence interval. Such plots are useful in identifying regions of explanatory variables within which the model did not adequately fit the data. Royston and Sauerbrei [4] present their results using an univariate runningline smoother implemented in the Stata software by Sasieni [24], and similar results can be produced in the R software using Friedman s supersmoother [25]. The above tools may be applied to the final curve, after smoothing across GA, or locally, at age-specific levels. Extension to longitudinal data Longitudinal data arise from observing the same individuals repeatedly over time [26]. As already mentioned, our planned study will aim to construct fetal reference charts for the Czech population using data from our centre. Some fetuses are examined only once during pregnancy. However, a considerable proportion of fetuses is measured more than once (up to ten times). A purely cross-sectional data analysis approach would clearly be incorrect because serial measurements on an individual fetus are highly correlated and the effective sample size is likely to be nearer to the number of fetuses than to the number of observations. The typical assumption of traditional regression about the independence of observations is certainly violated. Assuming random sampling of fetuses, it is plausible that subjects are independent, but the observations that are nested within subjects are dependent. In cross-sectional data analysis the focus is on betweensubjects variability and differences, but longitudinal data analysis adds the dimension of within-subjects variability. Applying traditional regression to longitudinal data is incorrect because the within-subject variability is ignored leading to biased standard errors and related inferential statistics. Clearly, traditional regression is inappropriate for longitudinal data and an appropriate alternative needs to be used [18]. Linear mixed effect regression Linear mixed effects regression (LMER) is a method for the analysis of clustered (or nested) data that includes longitudinal data [27]. Correlation due to repeated measures is accounted for by subject-level terms known as random effects, which allow for individual variation in change curves. LMER also has fixed effects, which are similar to the traditional regression coefficients, constant among individuals, and index group-level change [18]. The presence of fixed effects and random effects gives rise to the term LMER. In the longitudinal context, an individual s random effects indicate the deviation of their regression line from the group regression line. When straight-line change is considered, we can have two different (but possibly correlated) random effects: random intercepts (the difference between individuals intercepts and the group intercept) and random slopes (the difference in rate of change for individuals compared to the group slope). In the case of fetal biometry it seems appropriate to consider both random effects. The biological nature of fetal growth suggests that not only are there differences in the size at the starting point of the observation period (represented by the intercept), but also in the rate of growth (represented by the slope). An advantage of LMER is that all subjects need not be measured at the same times nor have the same numbers of observations. Time imbalance is a quality of our data set, as the individual fetuses differ in the number of measurements (from one to about ten), and the timing of measurements differ between the fetuses (some closely spaced and others more distantly spaced). In our view, LMER constitutes a desirable approach because of the following: LMER can accommodate missing data. Subjects who have data for at least one time point can be included in the analysis. (ML estimation is unbiased assuming the missing data mechanism is ignorable.) LMER is very flexible regarding the structure of the data. Timing of observations can vary among subjects, and the distance between time points need not to be equal. LMER provides control over the number and nature of terms used to model change over time. CPs, FPs, and a wide variety of other transformation (e.g., splines) can be accommodated. Turning to the specifics of LMER, suppose y ij is the response score for the ith individual (i = 1,..., N) at the jth time point (j = 1,..., n i ), m is the number of Semantic Interoperability in Biomedicine and Healthcare
97 Hynek M. et al. Statistical Methods for Constructing Gestational Age-Related Charts predictors of the fixed effects, and l is the number of predictors of the random effects (both excluding intercept). The general form of the classical LMER model is [28, 29] y i = X i β + Z i b i + ε i, (4) where y i is an n i 1 individual time series vector, X i is a known n i (m + 1) design matrix for the fixed effects, β is a (m + 1) 1 vector of unknown fixed effects, Z i is an n i (l + 1) known design matrix for the random effects, b i is a (l +1) 1 vector of unobserved random effects, and ε i is an n i 1 vector of unobserved random errors. More explicitly, if the predictors are FPs of time (t), X i = Z i = y i = y i1. y ij. y ini, ε i = 1 t p1 i1... t pm i t p1 in i... t pm in i 1 t p1 i1... t p l i t p1 in i... t p l in i ε i1. ε ij. ε ini, β =, b i =, (5) β 0 β 1. β m b 0i b 1i. b li, (6). (7) The columns of Z i are typically a subset of the columns of X i, so l m. For FP1, it is usual that l = m = 1 and random intercepts and random slopes are specified. The typical normality and related assumptions are summarized as b i N (0, G), ε i N (0, R i ), with b i ε i, (8) ie., the residual errors ε i for the same individual are independent of the random effects b i. We further assume R i = σ 2 εi ni, where I ni is an n i n i identity matrix, and G is the (l +1) (l +1) unknown variance-covariance matrix for the random effects and the variances on the diagonal are non-negative. The fixed effects and variance components are typically estimated with full ML or restricted ML (REML) [18, 28]. For example, the simple LMER linear trend model with random intercept and random slope uses an FP1 with p 1 = 1 (l = m = 1), y ij = (β 0 + b 0i ) + (β 1 + b 1i )t ij + ε ij. (9) Fractional polynomials As shown above, FPs can be directly incorporated into LMER. Because of the observed variation in fetal growth, it seems appropriate to include both random intercepts and random slopes in our LMER models. It can be shown that the correlation (covariance) of the random effects implies that the variability of fetal measurements can increase over time, which is a characteristic that is important to model. In the case of FP2 or even higher order models, there is a decision that needs to be made in regard to including additional random effects. The inclusion of many random effects can sometimes lead to estimation problems and lowered efficiency, especially if the sample size and/or the number of observations are limited. When selecting among models with a different number of fixed effects, it is important that the comparison models have the same number of random effects in order to make the source of misfit unambiguous. Therefore, comparison of FP1 and FP2 models should involve both having only two random effects. In anticipation of this type of comparison, we consider models with only two random effects. In general, FP1 for LMER is defined as y ij = (β 0 + b 0i ) + (β 1 + b 1i )t p1 ij + ε ij. (10) FP2 has two power terms, p 1 and p 2, and with p 1 p 2. When there are distinct powers, p 1 < p 2, and the FP2 with two random effects is y ij = (β 0 + b 0i ) + (β 1 + b 1i )t p1 ij + β 2t p2 ij + ε ij, (11) In the case of equal powers, p 1 = p 2, the model is y ij = (β 0 + b 0i ) + (β 1 + b 1i )t p1 ij + β 2t p1 ij log t ij + ε ij. (12) In the above FP2 models, the random slopes are based on the first type of FP transformation (ie., on p 1 ), but they can just as easily be based on the second (ie., on p 2 ). Furthermore, it should be noted that p 1 may be a different value among the FP1 and FP2 models when many comparisons are made as discussed below. In a pure exploratory analysis, we want to examine all FP1 and FP2 models. In this scenario, all the values in S are considered yielding nine FP1 models and (9+1)! 2!(9 1)! = 45 FP2 models. These 54 models are fitted using full ML rather than REML because they differ only in the number of fixed effects [18, 28]. Multimodel inference using Akaike s information criterion Given a total of 54 FP1 and FP2 fitted models, the selection of the best (or a best subgroup) is a challenging task. As already mentioned, in the case of cross-sectional data and traditional regression, Royston and Sauerbrei [4] proposed the use of the LRT. The LRT is problematic to use in this context because many comparisons will be made among models with the same numbers of parameters, and the LRT can only be used for nested model testing. Therefore, for the comparison of our 54 LMER models, we suggest an alternative strategy known as multimodel inference [30]. Multimodel inference is used routinely for model selection in ecology and wildlife biology [31, 32], and has been recently introduced for longitudinal Semantic Interoperability in Biomedicine and Healthcare
98 22 Hynek M. et al. Statistical Methods for Constructing Gestational Age-Related Charts... data analysis in the behavioral sciences [18] and medicine [33, 34]. Multimodel inference is a statistical strategy based on a new class of information-theoretic (I-T) approaches. The I-T methods allow one to select the best model from an a priori set, rank and scale the models, and include model selection uncertainty into estimates of precision [35]. I-T refers to the methods having a basis in Kullback- Leibler (K-L) information theory. K-L information represents the information loss when a particular model is used to approximate the model of full reality. The model of full reality is considered to be unknowable, so the goal here is to select the model in the set of possible models that minimizes K-L information loss (ie., the model that is closest to full reality). The methods considered here are due to Akaike [36] who found a formal relationship between K- L information and likelihood theory. He found that the maximized log-likelihood value is a biased estimate of K-L information and that this bias is approximately equal to the number of estimable parameters in the approximating model. The expected, relative K-L information can be estimated by Akaike s information criterion (AIC) defined as AIC = deviance + 2K = 2 log(l(ˆθ y)) + 2K, (13) where log(l(ˆθ y) is the value of the maximized loglikelihood over the unknown parameters (θ), given the data y, and K is the number of estimable parameters. The AIC penalizes the deviance by 2 times the number of estimated parameters which helps to guard against improving fit simply by adding a worthless predictor. In the case of small samples, a bias-adjusted form of the AIC should be used, the AIC-corrected (AICc)([37]). For longitudinal data, the AICc is computed as AICc = AIC + 2 K (K + 1) ( N ), (14) i n i K 1 where the summation is the total number of observed time points. As the sample size increases, the AICc approaches the AIC. Because of this, the AICc is recommended for both small- and large-sample situations [18]. The AICc can be used to rank-order a set of models in terms of their relative fit and plausibility. If one computes AICc for each of the H models from the a priori selected set, the model with the smallest AICc value is the best approximating model, ie., the closest to the unknowable truth. The AICc is only interpretable as a relative fit index. It is relative because we do not know the true model, and we cannot estimate its distance from a candidate model. However, by comparing different candidate models, we can measure how much better one approximating model is compared to another, ie., we can measure effect size. Several tools have been proposed to aid in model comparison based on the AIC (and AICc). One tool for model comparison is the difference between each candidate model and the best fitting of all the models. Let h denote the difference for the hth model. Then h = AICc h AICc min, (15) where h = 1,..., H, with H being the number of models, and AICc min is the smallest AICc value in the set of H models. The best fitting model has = 0 and the worst fitting model has the maximum. For any set of FP models, there is likely to be a subgroup that has similar good fit and other models with relatively poor fit. There are no definite cutoffs for distinguishing plausible and implausible subgroups of models. However, rough guidelines are the following: models with 2 have substantial plausibility support, those with 4 7 have considerably less support, and models with > 10 have essentially no support [31]. Another tool for model comparison is a scaled version of, known as the weight of evidence (or the Akaike weight) [31]. The weight of evidence for the hth model, W h, is a probability scaling of h, W h = exp( 0.5 h) H h exp( 0.5 h). (16) Given the data, the set of models, and the unknowable true model, W h indicates the probability that the hth model is the best approximating model [18]. The model with the largest W is the best approximating model, though many models can have close large values. Similar to, there are no rigid W cutoffs for model plausibility. However, W = 0.90 and W = 0.95 have been suggested as benchmarks [31]. In the event no single model has a particularly large probability, it is convenient to form a confidence set of the largest-valued models whose probabilities sum to 0.90 or A third tool for model comparison is the evidence ratio [31], which expresses how much more likely the best model is than a given model. Suppose that E h is the evidence ratio for the hth model. Then E h = W max W h, (17) where W max is the maximum weight of evidence in the set. Since E h is a ratio of probabilities, it also can be viewed as the odds that model h is not the best approximating model. The best fitting model has E = 1, and all other models have larger values. Having introduced three AICc tools for model comparison, there are some cautions to mention. Reiterating a previous point, the models to be compared should have the same number of random effects (and associated variance components), otherwise the AICc can be a biased guide in model selection [38, 39]. A second point is that, despite explicitly taking into account the number of predictors, AICc tends to favour complex models [40]. The AICc (and AIC) is not consistent in the sense that increasing the sample size will increase the probability of identifying the true model. This is not a problem if the researcher be- Semantic Interoperability in Biomedicine and Healthcare
99 Hynek M. et al. Statistical Methods for Constructing Gestational Age-Related Charts lieves that a true model is infinitely complex and that the AICc tools will help to identify the best approximation of this complexity (from among the candidate models). However, if a researcher believes there is a true model to be discovered, the tools can lead to over-fitting, which is the selection of a model that has too many parameters. Thus, the researcher s philosophical outlook can influence the degree to which the I-T methods might be useful. Alternative indexes can be used when the goal is to select the true model (see [41]). Multimodel inference is a natural way to deal with the multiple working hypotheses that often arise in applied medical research, especially with exploratory observational data. After a set of candidate models is a priori selected and fitted, the AICc and the related tools can be used to rank order the models in terms of plausibility and used to assess the relative effect size. An important point to bear in mind is that the results deeply depend on which models are selected into the set of candidate models; if none have merit, the models are still ranked. Thus, it is always important to bring substantive information to bear in assessing the worth of the model(s) estimated to be the best. Standard statistical methods can also be used to cope with this matter, for example, indexes of absolute effect size (e.g. R 2 ) and the analysis of regression residuals. Multimodel inference stands in contrast to the more popular method of null hypothesis statistical testing (NHST). Because multimodel inference may be new to many readers, it is perhaps worth pointing out some of the major distinctions of the AICc tools relative to NHST. In the I-T paradigm, the long-run frequentist principles apply to model estimation rather than decisions about hypotheses, as in NHST. Therefore, adjustment for multiple comparisons is irrelevant in multimodel inference. The AICc tools can be used to compare multiple model simultaneously, whereas NHST only considers two models at a time. The AICc tools can be used for comparison of nested and non-nested models. The AICc tools do not rely on arbitrary cutoffs for decisions about models, such as the p 0.05 cutoff in NHST. Models can simply be rank ordered and inferences made based on the ranks without necessarily relegating any models to the dustbin of insignificance. The AICc tools provide a clear measure of effect size, whereas NHST does not. The AICc tools do not require the assumption that at least one of the candidate models is true, whereas NHST does (the null model is assumed to be true). Tools such as the evidence ratio, allow one to determine evidence for a model, whereas NHST does not. Construction of fetal reference charts Having reviewed several methods, let us summarize the overall approach for constructing fetal reference charts from longitudinal data. The mean and SD model technique is applied when the mean and the SD of fetal biometric measurement y is modeled as a function of GA and FP functions are used to establish the relationship of y on GA. The set of 54 FP1 and FP2 LMER models is fitted to the data. Then multimodel inference using one of the I-T tools like the weight of evidence is used to select the best approximating model from the set. After the final model is selected, its absolute goodness-of-fit is thoroughly assessed. Finally, reference centile charts are constructed from the estimated best model. Conclusion The construction of fetal reference charts requires an appropriate statistical methodology, otherwise estimated centiles may be incorrect and may lead to false clinical conclusions regarding fetal development. Previous experience from many studies tells us that the distribution of fetal size is close to normal for any GA. Therefore, the most frequent method for the construction of fetal reference charts is the parametric approach with FP regression functions for the mean and SD of each fetal measurement. This article suggests how this method can be extended to longitudinal data using FPs in LMER. The presented approach includes ML estimation for fitting firstand second-order FP models, and multimodel inference using AICc and related tools as a suitable strategy for model selection. Acknowledgements The work was supported by the grant SVV of Charles University in Prague. Keywords Deviance Definition: Deviance is a quality of fit statistic for a model estimated with maximum likelihood methods. It represents a generalization of the idea of using the sum of squares of residuals in ordinary least squares to cases where model-fitting is achieved by maximum likelihood. The deviance for a model based on a dataset y, is defined as: 2 log(l(ˆθ y)) Semantic Interoperability in Biomedicine and Healthcare
100 24 Hynek M. et al. Statistical Methods for Constructing Gestational Age-Related Charts... where log(l(ˆθ y) is the value of the maximized loglikelihood over the unknown parameters (θ), given the data y. Reference: Nelder JA, Wedderburn RWM. Generalized linear model. J R Statist Soc A 1972; 135: SNOMED CT: no matching results found MeSH: no matching results found ICD10: no matching results found Kullback-Leibler information Definition: Described by S. Kullback and R. A. Leibler in Let f denote the full reality or truth, and let g denote an approximating model, a probability distribution. Kullback-Leibler information is a measure of the distance between f and g, and is defined for continuous functions as the integral I(f, g) = f(x) log ( f(x) g(x θ) ) dx where f and g are n-dimensional probability distributions. K-L information, denoted I(f, g), is the information loss when model g is used to approximate f. Then, the best model loses the least information relative to other models in the set; this is equivalent to minimizing I(f, g), over the set of models of interest. Synonyms: K-L information, Kullback-Leibler divergence, information divergence, information gain, relative entropy Reference: Burnham KP, Anderson DP. Multimodel inference: Understanding AIC and BIC in model selection. Sociol Methods Res 2004; 33(2): SNOMED CT: no matching results found MeSH: no matching results found ICD10: no matching results found Akaike information criterion Definition: Akaike information criterion is a measure of the relative quality of a statistical model for a given set of data providing a means for model selection. AIC is founded on Kullback-Leibler information theory, and it offers a relative estimate of the information lost when a given model is used to represent the process that generates the data. In addition, the AIC is an unbiased estimate of predictive accuracy, which is the ability of a model to predict new data. In doing so, it attempts to balance the tradeoff between the goodness of fit of the model and the complexity of the model. AIC = deviance + 2K = 2 log(l(ˆθ y)) + 2K, where K is the number of estimated parameters in the model and L is the maximized value of the likelihood function for the model. Given a set of candidate models for the data, the preferred model is the one with the minimum AIC value. Hence AIC rewards goodness of fit (as assessed by the likelihood function), but it also includes a penalty that is an increasing function of the number of estimated parameters. The penalty discourages overfitting, as increasing the number of parameters in the model always improves the deviance. The AIC offers a method of rank-ordering models for comparison and indexes the models relative effect sizes in terms of distance from the truth. Synonyms: AIC Reference: 1. Long J. Longitudinal data analysis for the behavioral sciences using R. Thousand Oaks, Calif.: Sage, Akaike H. Information theory as an extension of the maximum likelihood principle. In Petrov BN, Csaki F (Eds). Second international symposium on information theory. Budapest, Hungary: Akademiai Kiado, Burnham KP, Anderson DR, Huyvaert KP. AIC model selection and multimodel inference in behavioral ecology: some background, observations, and comparisons. Behav Ecol Sociobiol 2011; 65: SNOMED CT: no matching results found MeSH: no matching results found ICD10: no matching results found Degree of freedom Definition: In the context of likelihood ratio testing, the number of degrees of freedom is a parameter that identifies the specific reference chi-squared distribution used for hypothesis testing. It is the number of parameters that differ when comparing a simpler reduced model to a more complex full model. It is also a parameter used in other probability distributions related to the chi-square distribution, such as the Student distribution and the Fisher distribution. In another context, the number of degrees of freedom refers to the number of linearly independent terms involved when calculating the sum of squares based on n independent observations. The term degree of freedom was introduced by R. A. Fisher in Synonyms: df Reference: 1. Fisher RA. Applications of Student s distribution. Metron 1925; 5, Dodge Y. Semantic Interoperability in Biomedicine and Healthcare
101 Hynek M. et al. Statistical Methods for Constructing Gestational Age-Related Charts The Concise Encyclopedia of Statistics. Germany: Springer-Verlag, SNOMED CT: no matching results found MeSH: no matching results found ICD10: no matching results found Inference Definition: Inference is a form of reasoning by induction performed on the basis of information collected on a sample. It is the logic of generalizing sample information to the relevant associated population. Reference: Dodge Y. The Concise Encyclopedia of Statistics. Germany: Springer-Verlag, SNOMED CT: no matching results found MeSH: no matching results found ICD10: no matching results found References [1] Boulet SL, Salihu HM, Alexander GR. Mode of delivery and birth outcome of macrosomic infants. J Obstet Gynaecol 2004; 24: [2] Fang S. Management of preterm infants with intrauterine growth restriction. Early Hum Dev 2005; 81: [3] Hall MH, Carr-Hill RA. The significance of uncertain gestation for obstetric outcome. Br J Obstet Gynaecol 1985; 92: [4] Royston P, Sauerbrei W. Multivariable model-building: A pragmatic approach to regression analysis based on fractional polynomials for modelling continuous variables. Chichester, England: John Wiley, [5] Wright EM, Royston P. A comparison of statistical methods for age-related reference intervals. J R Statist Soc A 1997; 160: [6] Silverwood RJ, Cole TJ. Statistical methods for constructing gestational age-related reference intervals and centile charts for fetal size. Ultrasound Obstet Gynecol 2007; 29: [7] Hynek M. Approaches for constructing age-related reference intervals and centile charts for fetal size. Eur J Biomed Informatics 2010; 6: [8] Borghi E, Onis M, Garza C, et. al. Construction of the World Health Organization child growth standards: selection of methods for attained growth curves. Statist Med 2006; 25: [9] Altman DG, Chitty LS. Design and analysis of studies to derive charts of fetal size. Ultrasound Obstet Gynecol 1993; 3: [10] Villar J, Altman DG, Purwar M, et al.; International Fetal and Newborn Growth Consortium for the 21st Century. The objectives, design and implementation of the INTERGROWTH-21st Project. BJOG 2013; 120 (Suppl 2): [11] Ioannou C, Talbot K, Ohuma E, et al. Systematic review of methodology used in ultrasound studies aimed at creating charts of fetal size. BJOG 2012; 119(12): [12] Altman DG, Ohuma EO; International Fetal and Newborn Growth Consortium for the 21st Century. Statistical considerations for the development of prescriptive fetal and newborn growth standards in the INTERGROWTH-21st Project. BJOG 2013; 120 (Suppl 2): [13] Royston P, Altman DG. Regression using fractional polynomials of continuous covariates: Parsimonious parametric modelling. Appl Statist 1994; 43: [14] Altman DG. Construction of age-related reference centiles using absolute residuals. Statistics in Medicine 1993; 12: [15] Royston P, Wright EM. How to construct normal ranges for fetal variables. Ultrasound Obstet Gynecol 1998; 11: [16] Aitkin MA. Modelling variance heterogenity in normal regression using GLIM. Applied Statistics 1987; 36: [17] Mosteller F, Tukey J. Data analysis and regression: A second course. New York: Addison-Wesley, [18] Long JD. Longitudinal data analysis for the behavioral sciences using R. Thousand Oaks, Calif.: Sage, [19] Chitty LS, Altman DG. Charts of fetal size: limb bones. BJOG 2002; 109: [20] Papageorghiou AT, Kennedy SH, Salomon LJ, et al.; International Fetal and Newborn Growth Consortium for the 21st Century (INTERGROWTH-21st). International standards for early fetal size and pregnancy dating based on ultrasound measurement of crown-rump length in the first trimester of pregnancy. Ultrasound Obstet Gynecol 2014; 44: [21] Papageorghiou AT, Ohuma EO, Altman DG, et al.; International Fetal and Newborn Growth Consortium for the 21st Century (INTERGROWTH-21st). International standards for fetal growth based on serial ultrasound measurements: the Fetal Growth Longitudinal Study of the INTERGROWTH-21st Project. Lancet 2014; 384(9946): [22] Royston P, Wright EM. Goodness-of-fit statistics for agespecific reference intervals. Stat Med 2000; 19: [23] D Agostino RB, Belanger A, D Agostino Jr RB. A Suggestion for Using Powerful and Informative Tests of Normality. Am Stat 1990; 44: [24] Sasieni P, Royston P, Cox NJ. Symmetric nearest neighbour linear smoothers. Stata J 2005; 5: 285. [25] Friedman JH, Silverman BW. Flexible Parsimonious Smoothing and Additive Modeling. Technometrics 1989; 31(1): [26] Long J, Ryoo Jihoon. Using fractional polynomials to model non-linear trends in longitudinal data. Br J Math Stat Psychol 2010; 63: [27] Fitzmaurice GM, Laird NM, Ware JH. Applied longitudinal analysis. New York: Wiley, [28] Galecki A, Burzykowski T. Linear mixed-effects models using R a step-by-step approach. New York: Springer, [29] Laird N, Ware J. Random-effects models for longitudinal data. Biometrics 1982; 38: [30] Burnham KP, Anderson DR. Model Selection and Multimodel Inference. New York: Springer, [31] Burnham KP, Anderson DR. Multimodel inference: understanding AIC and BIC in model selection. Socio Meth Res 2004; 33(2): [32] Burnham KP, Anderson DR, Huyvaert KP. AIC model selection and multimodel inference in behavioral ecology: some background, observations, and comparisons. Behav Ecol Sociobiol 2011; 65: [33] Paulsen JS, Smith MM, Long JD; PREDICT HD investigators and Coordinators of the Huntington Study Group. Cognitive decline in prodromal Huntington: Disease: implications for clinical trials. J Neurol Neurosurg Psychiatry 2013; 84: [34] Leoni V, Long JD, Mills JA, et al.; PREDICT-HD study group. 24S-hydroxycholesterol correlation with markers of Huntington disease progression. Neurobiol Dis 2013; 55: [35] Burnham KP, Anderson DR. Kullback-Leibler information as a basis for strong inference in ecological studies. Wildl Res 2001; 28: Semantic Interoperability in Biomedicine and Healthcare
102 26 Hynek M. et al. Statistical Methods for Constructing Gestational Age-Related Charts... [36] Akaike H. Information theory as an extension of the maximum likelihood principle. In: Petrov BN, Csaki F, editors. Proceedings of the 2nd International Symposium on Information Theory; 1973; Budapest, Hungary: Akademiai Kiado. p [37] Hurvich CM, Tsai CL. Regression and time series model selection in small samples. Biometrika 1989; 76: [38] Liang H, Wu H, Zou G. A note on conditional AIC for linear mixed-effects models. Biometrica 2008; 95: [39] Vaida F, Blanchard S. Conditional Akaike information for mixed-effects model. Biometrica 2005; 92: [40] Link WA, Barker RJ. Model weights and the foundations of multimodel inference. Ecology 2006; 87: [41] Kadane JB, Lazar NA. Methods and criteria for model selection. J Amer Statist Assoc 2004; 99: Semantic Interoperability in Biomedicine and Healthcare
103 Krsička D., Šárek M. Significance of Cerebral Folate Deficiency for Development and Progression of Autism 27 Significance of Cerebral Folate Deficiency for Development and Progression of Autism Daniel Krsička 1, Milan Šárek st Faculty of Medicine, Charles University, Prague, Czech Republic 2 EuroMISE Mentor Association, Prague, Czech Republic Correspondence to: Daniel Krsička 1 st Faculty of Medicine, Charles University Address: Katerinska 32, , Praha, Czech Republic E mail: dkrsicka@gmail.com Aims of Research We aim at better understanding of underlying relations between autism or Autism Spectrum Disorders (ASD) respectively and Cerebral Folate Deficiency Syndrome (CFD), its etiology, pathophysiology and synergistic effects of a depletion of folates in the various critical developmental periods and other subclinical environmental insults or genome-wide predispositions. Some genes associated with ASD or other neurodevelopmental disorders have a metabolic role as they are translated into enzymes. We suppose that lack of folates can negatively influence some metabolic reactions critical for ASD development or progression in similar way like genetic pathologies even if appropriated genes are intact or synergistically strengthen an effect of less important genetic pathologies. Thus dysregulation of the substrates, metabolites or cofactors could result into the similar disorder like a dysfunctional polymorphism or deletion of appropriate gene under normal concentration of compounds. It could be also interesting to investigate further pathologic effects of folate depletion like changes in gene expression due to folate dysregulation, changes in developmental signaling pathways or change in DNA methylation patterns or relations to partial dysfunction of mitochondrions. Our hypothesis is based on a published clinical experience with diagnose and treatment of concomitant CFD by ASD with reported alleviation or even suppression of core ASD symptoms in some cases. Our first goal is to deterministically find relations among folate metabolism and metabolic reactions associated with autism in as widest informational scope as possible and to determine among the many published biochemical, physiological and clinical observations the significant ones for ASD development and progression. This knowledge, when created, could be further investigated in deeper detail for example relevance of the folate depletion for exact prenatal or postnatal developmental periods or dependency of the folate depletion to the higher male prevalence of ASD and many others. We can also test how is the gene expression changes under the condition of folate depletion i.e. which genes would be upregulated and whether some of them have, based on present knowledge, some association with ASD. The set of possible experiments is much wider and it is enriched also by an overlap with other diseases like schizophrenia, amnesia or trisomy 21 which seems to be also partially folate-dependent. State of the Art Etiology of autism or Autism Spectrum Disorders (ASD) is mostly unknown, genetic syndromes only account for an estimated 15% of autism cases. The ASD etiology is mostly multifactorial and due to this, an effective research should also investigate multiple factors. In our recent review [1], we ve found a total of 351 published cases of CFD with variable ASD reported in 44% of patients and 56% of these cases have been caused by Folate Receptor Auto Antibodies (FRAA), disturbing or even blocking transport of folates across the bloodbrain barrier. We re especially focused on these ASD cases due to it is quite hard to diagnose a CFD in ASD patients. The only available and completely reliable method is a lumbal puncture with examination of 5-MTHF (5- methyltetrahydrofolate) level in cerebrospinal fluid (CSF), not routinely indicated in ASD for its invasiveness. Less invasive methods, such as MR spectroscopy, have not the needed resolution in nmol/l at present. The FRAA assay is available only in a few laboratories in the world. It is therefore possible that a mild CFD in ASD escapes attention in diagnosis and treatment for a long time, and that it may contribute to development and progression of the ASD. Moreover, 29% of found ASD cases with concomitant CFD show that treatment of CFD can alleviate or occasionally even suppress the core ASD symptoms Semantic Interoperability in Biomedicine and Healthcare
104 28 Krsička D., Šárek M. Significance of Cerebral Folate Deficiency for Development and Progression of Autism [2, 3, 4, 5, 6, 7]. It couldn t be omitted that also other experimental studies of ASD treatment based on administration of substances, whose synthesis or concentration is directly or indirectly folate-dependent or folate-controlled or they act as cofactors in folate metabolic pathways have been published [8, 9, 10, 11, 12, 13]. Significantly elevated FRAA results in a typical degenerative, progressive CFD, however significance of slightly elevated FRAA levels or slightly decreased folate levels in CNS only is not yet precisely known for the pathophysiology of ASD. Abnormalities in folate levels can probably contribute to the many of epigenetic disturbances well-connected to etiology and pathophysiology of ASD and other neurodevelopmental and neurodegenerative disorders like abnormal genome methylation, oxidative stress, mitochondrial and neuronal damage or an abnormal immune response. The long term folate depletion itself is probably not needed but acting together with other factors like insignificant genetic mutations, subclinical environmental toxic burden, long-term stress or specific autoantibodies like the FRAA, it could explain and could cause abnormal CNS growth, neuronal differentiation, migration and pruning or activate apoptosis, leading to neurodegeneration. With relation to neural tissue, long-term insult influence is not needed. The influence of short- or medium-term folate depletion in various developmental intervals has not been systematically studied. The prevalence of mild CFD in ASD is not sufficiently mapped, as well as the contribution of individual pathological causes. This is a very small population tested (total 351 published cases). Even the therapeutic effect on ASD symptoms in treatment of mild CFD has not yet been sufficiently documented. Published results clearly show the need of the further research in this area, primarily because the ASD is currently considered as an incurable lifelong disorder of unknown etiology with a high socio-economic burden. In ASD patients with proven CFD have been repeatedly described improvements of neurological symptoms and also in core ASD symptoms. Some publications show the negative correlation between the age of the patient and treatment outcome. Therefore, an early intervention seems to be essential. Present research of ASD underlying causes consists of 2 major streams. The first stream investigates the polygenic influence of many genes and concentrates on the genome itself. The second stream focuses on epigenetic changes and environmental factors. Both research streams comprise a Big Data Challenge like high-volume data processing from personalized whole genome sequencing, huge data set comparison, automation of new information derivation and others. According to several recent research results it seems that a folate-dependent phenotype could exist for the ASD and the folate depletion can also contribute to development or deterioration of other diseases like schizophrenia [14, 15, 16], sudden adult amnesia [17] or trisomy 21 [18]. These phenotypes can consist of an influence of several harmful factors synergistically acting with folate depletion. The genetic component still seems to be important but cannot convincingly explain all the cases and research results. It seems that the environmental factors, forming the epigenetic influences, should be taken into account. These factors can manifest in other way and couldn t be primarily connected to the ASD in clinical praxis. A folate-dependent ASD phenotype, when found, could help to significantly affect the further clinical research of ASD treatment according to the rules of evidence based medicine. For the effective resolution of phenotypes, screening, early diagnostics and biological therapies for ASD it is necessary to better understand the synergistic effects of several genetic and epigenetic causes, which together manifest as neurobehavioral syndrome, but each independently represents only a subclinical, not manifest problem. Heterogeneous causes which can occur simultaneously and synergistically reinforcing each other if they are not examined all together, make practically impossible to correctly select the test group for a clinical trial. Mixed test groups composed of more mutually different ASD phenotypes would affect the outcome of each trial in a random manner and the results of these studies would have always the significant differences. Gradually, it would be possible to identify only the dominant causes, as appears to be in serious CFD based on FRAA. Conversely, if it were possible to identify and classify particular, separately insignificant, but collectively manifest causes, it would contribute significantly to the identification of novel ASD etiologies. Therefore, identification and classification of each new ASD phenotype is crucial for further progress. Application in Biomedicine and Healthcare We ve some preliminary results confirming our hypotheses. There are 2 main practical usages for our research results of folate-dependency of ASD. prevention treatment By the ASD as the lifelong, generally incurable disease is crucial to identify the fragile pregnancy or even parents as soon as possible. If there s a relation between folate depletion and some relatively novel insults like FRAA influencing a developing fetus or child, it must be identified in order to prevent or early compensate the problem before ASD can develop. We suppose that better and deeper understanding of relations among folates and pathophysiology of ASD can expose other genetic, epigenetic or environmental risk factors, which can contribute to significance of the mild folate depletion thus the factors defining a folate-fragile ASD phenotype. This information could be used for development of novel population screening, early intervention and overall could lead to reduction of ASD prevalence and its socioeconomic burden. Last but not least utilization of Semantic Interoperability in Biomedicine and Healthcare
105 Krsička D., Šárek M. Significance of Cerebral Folate Deficiency for Development and Progression of Autism 29 the research results could be the still open possibility to use folates as a part of biologically-based ASD therapy also for already developed cases. Acknowledgements This paper has been partially supported by the SVV project of Charles University in Prague. Keywords Autism Definition: Pervasive neurodevelopmental disorder characterized by impaired communication skills, dysfunctional social interaction, imagination insufficiency and stereotypic behavior. Synonyms: Autism spectrum disorder, childhood autism (inaccurate) Reference: SNOMED CT: MeSH: F ICD10: no exact reference found (only inaccurate F84.0) Cerebral Folate Deficiency Syndrome Definition: Progressive neurodegenerative syndrome, mostly in early childhood, characterized by decreased level of folate compounds in the central nervous system with simultaneously normal systemic levels. Synonyms: Neurodegeneration due to lack of cerebral folates Reference: SNOMED CT: not found MeSH: not found ICD10: no exact reference found (only inaccurate E53.9) Folate Definition: One of biologically active forms of the folic acid mutually different by variable oxidation/reduction status and variable number of glutamic residues. Synonyms: Folic Acid, Pteroylglutamic Acid, Vitamin B9 Reference: acid SNOMED CT: MeSH: D ICD10: not found Folate Receptor 1 Definition: A subtype of GPI-anchored folate receptors that is expressed in tissues of epithelial origin, clinically significant in the plexus choroid due to 3-times higher cerebrospinal folate concentrations in comparison with blood level. Synonyms: FOLR1 receptor Reference: receptor_1 SNOMED CT: not found MeSH: D ICD10: not found Folate Receptor Autoantibody Definition: IgM or IgG autoantibody against FOLR1 protein disrupting or blocking the high-affinition, low-concentration folate receptor FOLR1 significantly expressed on the blood-brain barrier. Synonyms: Folate Receptor Antibody, FOLR1 Antibody Reference: SNOMED CT: not found MeSH: not found ICD10: not found References [1] D. Krsička, M. Vlčková, and M. Havlovicová, The Significance of Cerebral Folate Deficiency for the Development and Treatment of Autism Spectrum Disorders, Int. J. Biomed. Healthc., vol. 1, no. 1, [2] V. T. Ramaekers, S. P. Rothenberg, J. M. Sequeira, T. Opladen, N. Blau, E. V Quadros, and J. Selhub, Autoantibodies to folate receptors in the cerebral folate deficiency syndrome., N. Engl. J. Med., vol. 352, no. 19, pp , May [3] V. T. Ramaekers, J. M. Sequeira, N. Blau, and E. V Quadros, A milk-free diet downregulates folate receptor autoimmunity in cerebral folate deficiency syndrome., Dev. Med. Child Neurol., vol. 50, no. 5, pp , May [4] P. Moretti, S. U. Peters, D. Del Gaudio, T. Sahoo, K. Hyland, T. Bottiglieri, R. J. Hopkin, E. Peach, S. H. Min, D. Goldman, B. Roa, C. a Bacino, and F. Scaglia, Brief report: autistic symptoms, developmental regression, mental retardation, epilepsy, and dyskinesias in CNS folate deficiency., J. Autism Dev. Disord., vol. 38, no. 6, pp , Jul Semantic Interoperability in Biomedicine and Healthcare
106 30 Krsička D., Šárek M. Significance of Cerebral Folate Deficiency for Development and Progression of Autism [5] S. U. Steele, S. M. Cheah, A. Veerapandiyan, W. Gallentine, E. C. Smith, and M. A. Mikati, Electroencephalographic and seizure manifestations in two patients with folate receptor autoimmune antibody-mediated primary cerebral folate deficiency., Epilepsy Behav., vol. 24, no. 4, pp , Aug [6] R. E. Frye, J. M. Sequeira, E. V Quadros, S. J. James, and D. A. Rossignol, Cerebral folate receptor autoantibodies in autism spectrum disorder., Mol. Psychiatry, vol. 18, no. 3, pp , Mar [7] R. S. Al-Baradie and M. W. Chaudhary, Diagnosis and management of cerebral folate deficiency. A form of folinic acidresponsive seizures., Neurosciences (Riyadh)., vol. 19, no. 4, pp , Oct [8] D. A. Rossignol and R. E. Frye, Melatonin in autism spectrum disorders: a systematic review and meta-analysis., Dev. Med. Child Neurol., vol. 53, no. 9, pp , Sep [9] R. Coben, M. Linden, and T. E. Myers, Neurofeedback for autistic spectrum disorder: a review of the literature., Appl. Psychophysiol. Biofeedback, vol. 35, no. 1, pp , [10] K. Bertoglio, S. Jill James, L. Deprey, N. Brule, and R. L. Hendren, Pilot study of the effect of methyl B12 treatment on behavioral and biomarker measures in children with autism., J. Altern. Complement. Med., vol. 16, no. 5, pp , May [11] R. E. Frye, D. Rossignol, M. F. Casanova, G. L. Brown, V. Martin, S. Edelson, R. Coben, J. Lewine, J. C. Slattery, C. Lau, P. Hardy, S. H. Fatemi, T. D. Folsom, D. Macfabe, and J. B. Adams, A Review of Traditional and Novel Treatments for Seizures in Autism Spectrum Disorder: Findings from a Systematic Review and Expert Panel., Front. public Heal., vol. 1, p. 31, [12] E. A. Langley, M. Krykbaeva, J. K. Blusztajn, and T. J. Mellott, High maternal choline consumption during pregnancy and nursing alleviates deficits in social interaction and improves anxiety-like behaviors in the BTBR T+Itpr3tf/J mouse model of autism., Behav. Brain Res., Oct [13] K. Williams, A. Brignell, M. Randall, N. Silove, and P. Hazell, Selective serotonin reuptake inhibitors (SSRIs) for autism spectrum disorders (ASD)., Cochrane database Syst. Rev., vol. 8, p. CD004677, Jan [14] V. T. Ramaekers, B. Thöny, J. M. Sequeira, M. Ansseau, P. Philippe, F. Boemer, V. Bours, and E. V Quadros, Folinic acid treatment for schizophrenia associated with folate receptor autoantibodies., Mol. Genet. Metab., Oct [15] A. Ho, D. Michelson, G. Aaen, and S. Ashwal, Cerebral folate deficiency presenting as adolescent catatonic schizophrenia: a case report., J. Child Neurol., vol. 25, no. 7, pp , [16] Q. Wang, J. Liu, Y.-P. Liu, X.-Y. Li, Y.-Y. Ma, T.-F. Wu, Y. Ding, J.-Q. Song, Y.-J. Wang, and Y.-L. Yang, [Methylenetetrahydrofolate reductase deficiency-induced schizophrenia in a school-age boy]., Zhongguo Dang Dai Er Ke Za Zhi, vol. 16, no. 1, pp. 62 6, Jan [17] Z. Sadighi, I. J. Butler, and M. K. Koenig, Adult-onset cerebral folate deficiency., Arch. Neurol., vol. 69, no. 6, pp , [18] H. Blehaut, C. Mircher, A. Ravel, M. Conte, V. de Portzamparc, G. Poret, F. H. de Kermadec, M.-O. Rethore, and F. G. Sturtz, Effect of leucovorin (folinic acid) on the developmental quotient of children with Down s syndrome (trisomy 21) and influence of thyroid status., PLoS One, vol. 5, no. 1, p. e8394, Jan Semantic Interoperability in Biomedicine and Healthcare
107 Mužný M. et al. Integration of Various Lifestyle and Diabetes Devices Integration of Various Lifestyle and Diabetes Devices Within a Diabetes Self-management Application Miroslav Mužný 1,2, Martina Vlasáková 1 Jan Mužík 1,2, Eirik Arsand 3 1 First Faculty of Medicine, Charles University in Prague, Czech Republic 2 Faculty of Biomedical Engineering, Czech Technical University in Prague, Czech Republic 3 Norwegian Centre for Integrated Care and Telemedicine, University Hospital of North Norway, Tromso, Norway Correspondence to: Miroslav Mužný Spin-off Application Centre, First Faculty of Medicine, Charles University in Prague Address: Studnickova 7, Prague 2 E mail: mmuzny@gmail.com Aims of Research People with diabetes have an opportunity to better manage their disease by using various devices, which may help them understand how their body reacts in different situations. Specifically, this can be facilitated by modern smartphone capabilities and use of a digital diabetes diary, acting as a natural aggregator and interpreter of collected data. An additional important role can be played by wearable devices, which are able to integrate multiple sensors and therefore may effectively merge functionality of multiple single-purpose devices. However, integrating data from various sensors raises the risk of possible personal health data misusage. The sensitive data-flow into a digital diabetes diary has to be handled appropriately carefully to avoid putting their users at risk of health complications [1]. So, what kind of mobile diabetes applications might be relevant to users? Potential applications and sensors are those gathering physical activity data, nutrition data, heart rate data, weight data, data from insulin pumps, and (continuous) blood glucose data. Such data can be supplied by physical activity trackers, smartwatches, smart-scales and body sensors. Each of the elements, which is part of a digital diabetes diary system, may provide a new point of view on personal diabetes self-management. However, due to lack of secure, open communication interface, every device has to be integrated separately, paying attention to possible risks for the patient user. In our research we study the possibilities of utilizing different commercially available diabetes and lifestyle devices within our smartphone application, the Diabetes Diary [2]. State of the Art One of the most discussed issues within using diabetes devices at the time being is the impossibility to have control over the users own data. Currently, the most popular approach is to upload collected data to a cloud-based data storage, which serves as a backup media and also acts as a server node for remote synchronization between multiple devices. Thus, a timely question is: are users really interested in having their personal health data stored on a remote server (in the cloud)? Lifestyle and diabetes device manufacturers are generally protecting direct data acquisition from their devices and provide this feature exclusively to their own software applications []. Therefore the possibilities for a local integration, with the users own choice of smartphone-based applications, are limited. Although, this is officially provided for some of the devices (e.g. Misfit activity tracker [3]), for its majority a direct communication interface is unavailable and it s availability even decreases when crossing from a category of lifestyle devices (e.g. physical activity trackers) to diabetes devices (e.g. blood glucose meters). Also, advantages of having personal data stored in a cloud are unbalanced by an increased risk of possible security issues, which can lead to a full disclosure of personal data in a worst case. Application in Biomedicine and Healthcare The last couple of months have shown the importance of community-based movements which provide an alternative software platform on the market. One of those is Nightscout, which can be also found under the #WeAreNotWaiting hash tag identifier on the internet Semantic Interoperability in Biomedicine and Healthcare
108 32 Mužný M. et al. Integration of Various Lifestyle and Diabetes Devices... [4]. This community s efforts led to a provision of a smartphone-based setup for the Dexcom continuous blood glucose meters (CGM). This setup allows a user to retrieve data from these CGMs using a generally available equipment (USB OTG cable) and to use the blood glucose data for various purposes (e.g. remotely monitoring a child with diabetes s blood glucose management). Another example is Diabeto, a startup project which aims to design and develop a device for a better integration of various blood glucose meters within mobile applications [5]. Their device will plug into a jack connector of a blood glucose meter and wirelessly transfers blood glucose measurements to a smartphone application. Similar approach would significantly facilitate use of multiple blood glucose meters and allow more secure data integration with a digital diabetes diary. Thanks to these community-initiated innovations, it is significantly easier to utilize various diabetes data into digital diabetes diaries. Even though all of these innovations are not officially supported by devices producers and may require a technical knowledge beyond the one of ordinary user, they open new possibilities on how to utilize relevant data in different scenarios of daily life for a better diabetes treatment. Acknowledgements This paper has been partially supported by the SVV project of Charles University in Prague. Keywords Wearable Technology Definition: Clothing and accessories incorporating computer and advanced electronic technologies. Synonyms: Wearables, Tech togs, Wearable devices Reference: /Wearable_technology SNOMED CT: not found MeSH: not found ICD10: not found Closed-loop System Definition: System for an automated insulin delivery which is made up of three components: a subcutaneous glucose sensor, the insulin delivery algorithm (running on a laptop computer), and the intraperitoneal insulin infusion pump. Synonyms: Artificial pancreas Reference: Renard, Eric, et al. Closed-loop insulin delivery using a subcutaneous glucose sensor and intraperitoneal insulin delivery feasibility study testing a new model for the artificial pancreas. Diabetes Care 33.1 (2010): SNOMED CT: MeSH: not found ICD10: not found Insulin Pump Definition: Portable or implantable devices for infusion of insulin. Includes open-loop systems which may be patient-operated or controlled by a pre-set program and are designed for constant delivery of small quantities of insulin, increased during food ingestion, and closed-loop systems which deliver quantities of insulin automatically based on an electronic glucose sensor. Synonyms: Insulin Infusion Systems Reference: National Library of Medicine SNOMED CT: MeSH: D ICD10: not found Activity Tracker Definition: Activity monitor worn on the upper limbs to measure physical activities. Synonyms: Physical activity tracker, Physical activity sensor Reference: Yang, Che-Chang, and Yeh-Liang Hsu. A review of accelerometry-based wearable motion detectors for physical activity monitoring. Sensors 10.8 (2010): SNOMED CT: not found MeSH: not found ICD10: not found Remote Patient Monitoring Definition: A communications network for providing continuous patient monitoring to provide critical. care services from a remote location. Synonyms: Remote monitoring Reference: Rosenfeld, Brian, and Michael Breslow. Telecommunications network for remote patient monitoring. U.S. Patent No. 7,256, Aug Semantic Interoperability in Biomedicine and Healthcare
109 Mužný M. et al. Integration of Various Lifestyle and Diabetes Devices SNOMED CT: not found MeSH: not found ICD10: not found References [1] KLONOFF, David C. Cybersecurity for Connected Diabetes Devices. Journal of diabetes science and technology, 2015, [2] ARSAND, Eirik, SKROVSETH, Stein Olav, JOAKIMSEN, Ragnar Martin, HARTVIGSEN, Gunnar. Design of an Advanced Mobile Diabetes Diary Based on a Prospective 6-month Study Involving People with Type 1 Diabetes. The 6th International Conference on Advanced Technologies and Treatments for Diabetes, February March , Paris. France. [3] Misfit Scientific Library. Available from: [4] The Nightscout Project. Available from: [5] Diabeto. Available from: Semantic Interoperability in Biomedicine and Healthcare
110 34 Rak D., Svátek V. Matching Medical Websites to Medical Guidelines through Clinical Vocabularies Matching Medical Websites to Medical Guidelines through Clinical Vocabularies Dušan Rak 1, Vojtěch Svátek 2 1 First Faculty of Medicine, Charles University in Prague, Prague, Czech Republic 2 Faculty of Informatics and Statistics, University of Economics, Prague, Czech Republic Correspondence to: Dušan Rak Address: U Zátiší 545/9, 14700, Praha 4 E mail: dusan.rak@seznam.cz Aims of Research We propose and test simple approach exploiting MGL content as a benchmark for the assessment of content quality in medical web sites (WS). It is based on the idea that the information content or at least the scope of a medical text is reflected in the domain terminology used. We consider a possible use of this approach in semiautomatic human-based quality verification and various aspects related to its application. Clinical vocabularies are used to discover medical terminology in both groups of texts (MGL and WS). Both sets of terminology are then compared based on extracted data. The WS content quality is assessed firstly based on general content match (i.e. based on concepts or topics discovered) and secondly based on similarity of the particular terminology used in MGLs. Partial goal is to propose and evaluate suitable methods of aggregation of terminology in MGLs so that only one single standard for WS quality assessment might be applied in the end. Important goal is to evaluate the overall applicability of this approach in the process of semiautomatic quality assessment. State of the Art Modern technology offers a wide array of possibilities for anyone to publish almost any content freely on the Internet. Because of the importance and delicacy of medical information, the quality of such texts provided to general public seems to be a serious issue nowadays. Specialized organizations (such as HON [1]) scan the Internet actively or audit content/form of submitted WS. As more and more WS for medical domain are created the need for automation of this process is obvious. Unfortunately the only feasible way to approve the adequacy of the medical information content is human verification today. Best practices in medicine are systematically captured by medical guidelines (MGL), which are provided by renowned medical societies and based on results of Evidence-Based Medicine (EBM) [2]. MGLs are published in a well structured text form (aiming for medical professionals) and sometimes additionally in highly formalized form such as GLIF [3]. Purpose of this further formalization is to allow automation of MGL content processing it in information systems. Application in Biomedicine and Healthcare MGLs form important quality benchmark for any particular area of medicine. It is invaluable source of quality information for GP professionals and same for specialists in WS certification agencies. Despite being very well structured and formalized the use of MGLs for fully automatic content assessment is far from possible yet. Such application would require very advanced machine understanding of processed text. On the other hand, simple and straightforward approach based on similarity analysis between the two extracted terminology sets (from MGLs and WS) seems to be feasible and effective in yielding some meaningful quality measures. Additionally, comprehensiveness of content and quality of terminology used or WS similarity groups can be estimated. Beyond these quantitative measures value-added in form of WS annotated by scientific terminology can be offered to certification authority experts. Acknowledgements This paper has been partially supported by the SVV project of Charles University in Prague. Semantic Interoperability in Biomedicine and Healthcare
111 Rak D., Svátek V. Matching Medical Websites to Medical Guidelines through Clinical Vocabularies 35 Keywords Annotation Definition: Annotation means providing base data (text, video, picture, etc.) by descriptive or analytic notations, tags or other meta-information (see: linguistic annotation). Synonyms: Linguistic annotation, Tagging Reference: multiple reference SNOMED CT: not found MeSH: not found ICD10: not found Concept Definition: Cognitive unit of meaning an abstract idea or a mental symbol sometimes defined as a unit of knowledge, built from other units which act as a concept s characteristics and inferred from specific instances or occurrences. A concept is typically associated with a corresponding representation in a language or symbology such as a single meaning of a term. Synonyms: Entity, Idea Reference: multiple reference, modified from http: //en.wikipedia.org/wiki/concept and SNOMED CT: not found MeSH: not found ICD10: not found Evidence-Based Medicine (EBM) Definition: EBM is the conscientious, explicit, and judicious use of current best evidence in making decisions about the care of individual patients. The practice of evidence based medicine means integrating individual clinical expertise with the best available external clinical evidence from systematic research. The strength of scientific evidence of the risks and benefits of treatments (including lack of treatment) and diagnostic tests are taken into account. Synonyms: Evidence-based practice (EBP) (a broader term) Reference: Sackett DL. Evidence based medicine: what it is and what it isn t. BMJ 1996;312:7 SNOMED CT: not found MeSH: D ICD10: not found Similarity Definition: A concept whereby a set of documents or terms within term lists are assigned a metric based on the likeness of their meaning/semantic content. Synonyms: Semantic similarity, Semantic closeness, Proximity, Nearness, Relatedness Reference: /Semantic_similarity SNOMED CT: not found MeSH: not found ICD10: not found Unified Medical Language System (UMLS) Definition: A compendium of many controlled vocabularies in the biomedical field. It was created in 1986 by NLM. Its purpose is to facilitate the development of computer systems that behave as if they understand the meaning of the language of biomedicine and health. To that end, NLM produces and distributes the UMLS Knowledge Sources (databases) and associated software tools (programs) for use by system developers in building or enhancing electronic information systems that create, process, retrieve, integrate, and/or aggregate biomedical and health data and information, as well as in informatics research. Three UMLS Knowledge Sources exist: the Metathesaurus, the Semantic Network, and the SPECIALIST Lexicon. Synonyms: UMLS Reference: NML On-Line SNOMED CT: not found MeSH: D ICD10: not found References [1] Health On the Net Foundation [Internet]. Available from: [2] Sackett DL. Evidence based medicine: what it is and what it isn t. BMJ 1996;312:7 [3] Ohno-Machado L, et al. The GuideLine Interchange Format: A Model for Representing Guidelines. J Am Med Inform Assoc Jul-Aug; 5(4): Semantic Interoperability in Biomedicine and Healthcare
112 36 Seidl L., Hanzĺıček P. International Communication Protocols for Interoperability in the Czech Republic International Communication Protocols for Interoperability in the Czech Republic Libor Seidl 1, Petr Hanzĺıček 2 1 First Medical Faculty, Charles University in Prague, Prague, Czech Republic 2 ČD Cargo, Prague, Czech Republic Correspondence to: Libor Seidl Centre for ehealth a Telemedicine Adresa: Studničkova 7, Prague 2, , Czech Republic E mail: Libor.Seidl@lf1.cuni.cz Aims of Research The aim of this research is to identify possibilities and to asses barriers in utilization of international communication protocols in the Czech healthcare. Czech healthcare in field of system s interoperability relies namely on a Czech data protocol called DASTA. This protocol was founded in 1997 and has been developed jointly by Czech vendors to fulfil topical needs of data exchange. Cursory reading the protocol specification you will not reveal any definition of a trigger event (when data are communicated), you will not find any semantics of a transfer (what is the meaning of data transfer - record create/delete), you will not find any communication party responsibilities, and finally you will not find any consequent communication interactions defined. Although not presented that way, the DASTA is rather a standardised structure used in fashion of document handling than a real communication protocol. International protocols on the other hand offer message based protocols (HL7 v2, HL7 v3) as well as document based specifications (HL7 CDA, CCR and EN 13606). With respect to wide deployment of DASTA, a gradual involvement of international standards will bring a need to run inter-protocol gateway for various protocols. In this process of continuous change various scenarios will newly appear and change or vanish later requesting high flexibility of inter-protocol transformations. Thus the gateway cannot be a hard-coded singlepurpose transformation. Repetition of conformance tests after each upgrade will be expensive and will definitely slow down any transformation process. We see a solution in a semi or fully automated configuration of such gateway based on formalised knowledge about the enviroment, about protocols itself, and about a clinical domain in question. Ontology description of protocols and mappings between them will enable an assessment of DASTA protocol content, its way of use and will enable to identify obstacles when deploying international protocols to the Czech healthcare. State of the Art System s architecture description is in general defined in ISO/IEC/IEEE since 2011 superceding original IEEE 1471:2000 norm. This norm also places a system into an environment, fulfiling a certain role or a mission from which stakeholders have profits. Generic Component Model (GCM)[2] describes an architecture of a generic information system by proposing three orthogonal views: a domain perspective, system s architecture perspective and a view of software development process. These three perspectives form a cube divided into several sub-cubes. Every atomic sub-cube address a particular problem at respective levels of all three perspectives. The GCM propose to describe a system in each sub-cube and then provide interconnection between neighboring sub-cubes by appropriate transformations. Frank Oemig was the first who proposed an ontology description of HL7 v2 and HL7 v3 communication standards. In his PhD work [3] he involved the GCM approach. To obain a machine readable mapping he described both standards using a Communication Standards Ontology (CSO)[4], an upper level ontology. HL7 v2 was represented in OWL by automatic transformation of MS Access HL7 Database, HL7 v3 was represented in OWL by transforming a MIF (Message Interchange File Format) into OWL. Mapping between both standards was facilitated by a domain ontology (patient administration) ACGT (Advanced Clinico-Genomic Trial Ontology). An overview of all ontology composition is shown in Figure 1. Semantic Interoperability in Biomedicine and Healthcare
113 Seidl L., Hanzĺıček P. International Communication Protocols for Interoperability in the Czech Republic 37 Figure 1: Composition of ontologies after Frank Oemig [3]. Application in Biomedicine and Healthcare Research in this field should identify suitable ontologies, extend them and create bridging ontologies so a comprehensive ontological description of integration environment, clinical domain as well as involved communication protocols can be composed. The research should propose a path how various ontologies in neighboring GCM sub-cubes interconnect into a working unit. Such description will be suitable for an automatic gateway configuration as well as for an assessment of protocol maturity, suitability of integration in particular situation and for identification of deployment obstacles. An outcome of the applied research can be a technology demonstration of automatically configured interprotocol gateway for a selected use-case. A combination of a formalised knowledge and a reasoner can demonstrate a future way of software development of a complex and highly dynamic systems. Acknowledgements This paper has been partially supported by the SVV project of Charles University in Prague. Keywords Communication protocol Definition: Application protocol for electronic data exchange in healthcare. Synonyms: Communication standard Reference: aspx?term_id=1161&searchexp=communication% 20protocol SNOMED CT: not found MeSH: not found ICD10: not found DASTA Definition: DASTA is regularly updated open standard for communication among information systems in Czech healthcare. It covers clinical, laboratory, statistical and administrative domains. It also contains number of codelists including National Codelist of laboratory procedures, Codelist of Clinical Events and various statistical classifications. Synonyms: Data standard Reference: SNOMED CT: not found Semantic Interoperability in Biomedicine and Healthcare
114 38 Seidl L., Hanzĺıček P. International Communication Protocols for Interoperability in the Czech Republic MeSH: not found ICD10: not found Ontology Definition: Organization of concepts for which a rational argument can be made. Reference: term_id=1319&searchexp=ontology SNOMED CT: not found MeSH: not found ICD10: not found Domain Definition: A particular area of interest. Reference: term_id=1154&searchexp=domain SNOMED CT: not found MeSH: not found ICD10: not found Gateway Definition: Entity, which provides real-time, two-way communications between terminals. Reference: term_id=1006&searchexp=gateway SNOMED CT: not found MeSH: not found ICD10: not found References [1] Authors of DASTA. DASTA Evolution Basic Info DASTA [Internet]. [Cited 5. April 2014]. Available from: [2] Blobel B. Application of the Component Paradigm for Analysis and Design of Advanced Health System Architectures. International Journal of Medical Informatics. 18. July 2000;60: [3] Oemig F. PhD Thesis: Entwicklung einer ontologiebasierten Architektur zur Sicherung semantischer Interoperabilität zwischen Kommunikationsstandards im Gesundheitswesen [Internet]. [cited 2012 Jul 26]. Available from: [4] Oemig F, Blobel B. A Communication Standards Ontology Using Basic Formal Ontologies. Studies in Health Technology and Informatics. 2010: Semantic Interoperability in Biomedicine and Healthcare
115 Schlenker A., Reimer M. Big Data in Hospital Information Systems in the terms of Security 39 Big Data in Hospital Information Systems in the terms of Security Anna Schlenker 1,2, Michal Reimer 2 1 Institute of Hygiene and Epidemiology, First Faculty of Medicine, Charles University in Prague and General University Hospital in Prague, Czech Republic 2 Department of Biomedical Informatics, Faculty of Biomedical Engineering, Czech Technical University in Prague, Kladno, Czech Republic Correspondence to: Anna Schlenker Institute of Hygiene and Epidemiology, First Faculty of Medicine, Charles University in Prague & General University Hospital in Prague Address: Studničkova 7, Prague 2, Czech Republic E mail: schlenker.anna@gmail.com Aims of Research In the healthcare sector amount of data has been accumulated over the years. Nowadays, it is still most of the patient s documentation on paper. Thankfully, many records have been already converted to the electronic form. There is, of course, involved the processing of large volumes of data from electronic health records, which will gradually keep increasing [1]. Big data can be defined using so-called 4V definition [2]: 1. V = volume; This means that the volume of data increases exponentially. 2. V = velocity (speed); There are jobs requiring immediate processing of large volumes of data which are continuously generated. A suitable example may be processing data produced by the camera. 3. V = variety (variability); Besides processing the structured data, there are jobs for processing unstructured text, but also various types of multimedia data. 4. V = veracity (credibility); Uncertain credibility of data due to their inconsistency, incompleteness, ambiguity etc. A suitable example can be illustrated on the communication on social networks. The use of analysis of the big data can improve the quality of health care. In addition to support decisionmaking can analysis of big data also help with riskanalysis or cost-analysis in healthcare. Another possibility is use in developing medical guidelines [1]. Statistical analysis can also help with the better interpretation of the data stored in hospital information systems [3]. State of the Art In the area of hospital information systems the topic of security is very actual. On the one hand, current consulting rooms working without a computer and without the information system are rare, thankfully. On the other hand, many people are becoming interested in, who has access to these systems and the information in it [4]. Today, we put considerable emphasis on the fact that each user need their own login information. Another important thing is to have different editing rights for individual users in the information system (physician, nurse, laboratory technician, radiologist, technical staff, etc.). For users of hospital information systems are organized training sessions where health care professionals are getting familiar with the need for multifactor security of sensitive patient data [4]. The main reason is to make the hospital staff understand that entering the password is not only thing that delays them from work, but also the thing that can protect them. Then teach users that the information system is not only annoying software that do not let them continue their work without filling some fields, but show them that this field can be important [4]. Current State of Security in Hospital Information Systems Currently, the most of the hospital information systems remember on the safety and can set different rights for different users. Unfortunatelly, user who logs into the system is typically verified just by one method, usually by password. This password might not fulfil any of the conditions Semantic Interoperability in Biomedicine and Healthcare
116 40 Schlenker A., Reimer M. Big Data in Hospital Information Systems in the terms of Security needed for example for password resistant from the dictionary attack. Users should therefore remember, that their password should not consist of the name of the husband/wife, pet or other full-semantic words. Generally, the password should be long enough (at least 8 characters), composed of large and small letters, numbers and special characters. Secure password is the password which the user do not disclose to anyone (not even his/her husband/wife) and do not write it anywhere. For attackers, there is nothing easier than copy the password that is written in user s notebook [4]. Another mistake in most hospital information systems is that there is usually no automatic logoff. The reason is probably a waste of time for health care professionals because of constant logging into the information system. Apart of this, users of the information systems should realize that in the case of leaving the computer with logged in information system can cause the lose or change of the sensitive patient data [4]. Figure 1: Keystroke duration and keystroke latency. To make the data processing easier and clearer, we have extended the application of the second listview (see Figure 2), where we have the opportunity to display the second record. The application has also a sidebar textbox (see Figure 2) where, after marking a selected row in each entry, application calculate parameters of keystroke dynamics of individual user. Application also allows loading a previously scanned records and give us the possibility of back analysis [5]. Application in Biomedicine and Healthcare For the security enhancement in the field od hospital information systems we have designed an application that uses multi-factor authentication which combines the knowledge factor and the biometric factor. As a biometric factor we use a behavioural characterictic called keystroke dynamics. Keystroke dynamics describes exactly how the user types on the keyboard through the scanning when each key was pressed and when it was released. This application can be used in two ways: 1. As a application for static verification (username + password + keystroke dynamics when entering usermane and password). 2. As a application for continuous verification (verifies if the user who is working with the information system is the same user who is logged on). The biggest advantage of this application is collecting the data directly from the operating system, without any delay. The application records the key code, key name, key press time and release time. Our application also enables automatic analysis of scanned data. For the purpose of analysis the application calculates the timing vector, which consists of the keystroke duration which means the period of time a key is held for, and the keystroke latency which means the time between individual keystrokes (see Figure 1). Figure 2: Final version of the application for capturing keystroke dynamics. The application was implemented in C within the Microsoft Visual Studio Express Scanned data are exported to the CSV file. Acknowledgements This paper has been partially supported by the SVV project of Charles University in Prague. Keywords Big Data Definition: Big Data can be defined using so-called 4V definition, where V means volume, velocity, variety (variability) and veracity (credibility). Reference: [1] SNOMED CT: not found Semantic Interoperability in Biomedicine and Healthcare
117 Schlenker A., Reimer M. Big Data in Hospital Information Systems in the terms of Security 41 MeSH: not found ICD10: not found Information System Definition: Integrated set of files, procedures, and equipment for the storage, manipulation, and retrieval of information. Reference: /MB_cgi?mode=&term=Information+Systems &field=entry#treel SNOMED CT: MeSH: D ICD10: not found Hospital Information System Definition: Integrated, computer-assisted systems designed to store, manipulate, and retrieve information concerned with the administrative and clinical aspects of providing medical services within the hospital. Synonyms: HIS Reference: /MB_cgi?mode=&term=Hospital+Information +Systems&field=entry#TreeL SNOMED CT: MeSH: D ICD10: not found Multifactor Authentication Definition: A security system in which more than one form of authentication is implemented to verify the legitimacy of a transaction. Reference: [6] SNOMED CT: not found MeSH: not found ICD10: not found Keystroke Dynamics Definition: The detailed timing information that describes exactly when each key was pressed and when it was released as a person is typing at a computer keyboard. Synonyms: Typing Dynamics Reference: [7] SNOMED CT: not found MeSH: not found ICD10: not found References [1] Raghupathi W., Raghupathi V.: Big data analytics in healthcare: promise and potential. Health Information Science and Systems 2014, 2(3). doi: / [2] Schlenker A., Bohunčák A.: Keystroke Dynamics for Security Enhancement in Hospital Information Systems. International Journal on Biomedicine and Healthcare 2015; 3(1):41 44 [3] Kalina J.: Statistical Challenges of Big Data Analysis in Medicine. International Journal on Biomedicine and Healthcare 2015; 3(1):24 27 [4] Schlenker A.: Multifactor Data Security in Information Systems in Health Care. International Journal on Biomedicine and Healthcare 2014; 2(1):25 27 [5] Reimer M., Schlenker A. Ověřování identity na základě kontinuálního snímání dynamiky stisku počítačových kláves. Kladno, Bachelor thesis. České vysoké učení technické. [6] Badr Y., Chbeir R., Abraham A., Hassanien A.-E. (Eds.): Emergent Web Intelligence: Advanced Semantic Technologies, 1st Edition., 2010, XVI, 544, p.345 [7] Bergadano F., Gunetti D., Picardi C.: User authentication through Keystroke Dynamics. ACM Transactions on Information and System Security (TISSEC), 2002;5(4): Semantic Interoperability in Biomedicine and Healthcare
118 42 Sičová K. et al. Secondary Cataract in Patients after Implantation of Multifocal IOLs Secondary Cataract in Patients after Implantation of Multifocal IOLs Kristína Sičová 1, Petr Výborný 1, Jiří Pašta 1 1 Ophthalmology department, Central military hospital Prague, Czech Republic Correspondence to: Kristína Sičová Ophthalmology department, Central military hospital Prague Address: U Vojenské nemocnice 1200, Prague 6 E mail: kristina.sicova@uvn.cz Aims of Research With the recent rapid development of refractive eye surgery in developed countries, there are a growing number of operations carried out in patients of middle and old age, who come to see the ophthalmologist wishing to get rid of corrective lenses, or at least dramatically reduce their use. Modern refractive surgery offers this option to patients thanks to a wide range of intraocular lens implants. In the Czech Republic, multifocal diffractive intraocular lenses have recently become the ones most often implanted. This premium procedure demands not only a highquality surgeon and patient s cooperation, but also requires a supplementary payment from the patient. Therefore, it can be assumed that the patient expects the best possible outcome from this surgery, and any postoperative complications or worsening of the visual acuity becomes a significant problem. The most frequent late complication after an otherwise uncomplicated surgery, is the development of posterior capsule opacification (PCO) of intraocular lenses, decreasing the visual acuity, which can lead to the development of amblyopia. The previously mentioned problem becomes even more important in patients who undergo a premium IOL complex optics implantation surgery. Any complication after such surgery significantly reduces the possibility of using a multifocal lens optics. The aim of our research is to evaluate which factors lead to the development of a secondary cataract, whether its development is affected only by the performance of the surgery, surgical technique used, and the instrumentation, or whether there are other contributing factors such as the age, sex, and comorbidity of the patient, the presence or absence of a cataract preoperatively, the type of cataract, and the extent of preoperative refractive error. In our clinic, we have been performing refractive surgery with implantation of premium IOLs since 2005, and therefore have got a relatively large amount of followup patients. This fact allows us to evaluate the recorded data both retrospectively and prospectively, using modern objective imaging methods. State of the Art Currently, it is known that proliferation and migration of epithelial cells (LEC-lens epithelial cells) in particular areas of the lens equator are responsible for the posterior capsule opacification. Secondary cataract pathogenesis has two forms: fibrous changes in the anterior and posterior leaf of the lens capsule, and regeneration in the sense of newly formed lens tissue. Visual acuity is only affected by opacity located in the optical axis of vision. Contact between the optical part of the IOL (intraocular lens) with the lens epithelial cells of the anterior capsule leads to their differentiation into myofibroblasts, followed by the development of fibrosis and ACO (anterior capsule cataract). Their migration to the posterior leaf causes PCO. The emergence of the regenerative type of secondary cataract is caused by the proliferating and migrating LEC, which were left behind during surgery in the equator zone (E-called cells). Firstly, the remaining LEC produce a new lens material along the equator (Sommering ring), and secondly, they (LEC) migrate between the posterior leaf and IOL, where they create the Elschnig pearls [1]. The prevention of secondary cataracts has been shown to be influenced by the shape and material of the IOL, the intraoperative and postoperative treatment, and the surgical technique. The current preventive practice is the IOL implantation into the capsular bag, the use of IOL with sharp edges, and the extensive cleaning of the capsule. Even af- Semantic Interoperability in Biomedicine and Healthcare
119 Sičová K. et al. Secondary Cataract in Patients after Implantation of Multifocal IOLs 43 ter all these interventions, the development of secondary cataracts is not exceptional [2]. After the first post-op year, secondary cataracts affect around 11% of patients (in our study 1,25%) ; five years after the surgery, up to 28% of patients can be affected [3], (in our group 2,34%) (Figure 1.) Figure 1: Percentage incidence of secondary cataract after implantation MIOL over the years. The average variation is from 10% to 40% in three to five years after the surgery [4]. For some types of IOL it is only 5% [5]. Application in Biomedicine and Healthcare Secondary cataracts, even small-scale ones, can lead to a reduction of visual acuity in patients with multifocal intraocular lens. Worsening of vision manifests itself especially in reading for the short distance. This small PCO, which is in monofocal IOL insignificant, can develop half a year after the surgery [6]. The most common therapy remains NdYAG capsulotomy. There is a low risk of developing tears in the retina, retinal detachment, vitreous opacities formation, displacement or decentration of the IOL, and the deterioration of its function. Despite the high precision measurement of the intraocular lens power, the uncomplicated performance of surgery, and the initially uncomplicated postoperative course, there is a possibility of developing far-reaching complications. The above-mentioned complications may require further surgical intervention, including vitreo-retinal surgery and hospitalization of the patient. This can result in a permanent reduction of visual acuity, patient s disability, limitations in work and daily life, and thus ensuing financial consequences for both the patient and the healthcare. Due to the already mentioned increasing interest of phacosurgeons and patients in the multifocal implants, the importance of this issue increases. The aim of ophthalmic surgeons is to reduce the risk of secondary cataracts to a minimum, and to maintain good functioning implants for as long as possible. The provisional results of our research, present a lower incidence of secondary cataract than reported in the world literature. These results, independent of the material or the type of the intraocular implant, are in our opinion caused by our system of careful selection of suitable candidates for surgery, the protocol of the operation and postoperative therapy, as well as the post-operative checks, including established strict regime. Therefore, let us say that the results of our research may find an application both in cataract surgery and vitreoretinal surgery, as well as in the health sector when assessing the economic efficiency of procedures. Results of statistical analysis will certainly be of high value to opthalmologists. Moreover, the data about the comorbidity, age, and sex of the patients can offer interesting information to other fields of medicine, such as biomedical statistics. Perhaps the results of this study can help patients decide whether or not to undergo the premium IOL implantation surgery. Acknowledgements This paper has been partially supported by the SVV project of Charles University in Prague. Keywords Posterior capsule opacification (PCO) Definition: Opacitfication of the posterior capsular leaf. Synonyms: Secondary cataract Reference: Kanski J., Bowling B., Nischal K., Pearson A., Clinical Ophthalmology, A systemic approach, 7th edition, 2011; 295 SNOMED CT: MeSH: D ICD10: H264 Cataract Definition: Clouding of the natural intraocular crystalline lens that focuses the light entering the eye onto the retina. This cloudiness can cause a decrease in vision and may lead to eventual blindness if left untreated. Reference: Kanski J., Bowling B., Nischal K., Pearson A., Clinical Ophthalmology, A systemic approach, 7th edition, 2011; 295 SNOMED CT: MeSH: D ICD10: H25 Semantic Interoperability in Biomedicine and Healthcare
120 44 Sičová K. et al. Secondary Cataract in Patients after Implantation of Multifocal IOLs Intraocular lens (IOL) Definition: Artificial lens intended for permanent storage in the eye. Reference: Steinert R.F. Cataract surgery, 3 th edition, 2010; SNOMED CT: MeSH: D ICD10: Z961 Multifocal intraocular lens (MIOL) Definition: Intraocular lens. Reference: Steinert R.F. Cataract surgery, 3 th edition, 2010; SNOMED CT: SNOMED CT: MeSH: not found ICD10: Z961 NdYAG capsulotomy Definition: Surgical incision of the posterior lens capsule to remove the secondary cataract neodymium laser. Reference: Kanski J., Bowling B., Nischal K., Pearson A., Clinical Ophthalmology, A systemic approach, 7th edition, 2011; 295 SNOMED CT: MeSH: D ICD10: not found References [1] Sacu S., Menapace R., Findl O. et al. Influence of optic Eege design and anterior capsule polishing on posterior capsule fibrosis. Journal of cataract and refractive surgery, 2004; 30: [2] Krajčová P., Chynoranský M., Strmeň P. Opacifikácia zadného púzdra šošovky po implantácii rôznych typov umelých vnútroočných šošoviek - II. časť : rôzne peroperačné nálezy. Česká a slovenská oftalmologie, 2008; 64: [3] Bertelmann E., Kojetinsky C. Posterior capsule opacification. Current opinion in Ophthalmology, 2001; 12: [4] Pandey S.K., Apple D.J., Wener L. et al. Posterior capsule opacification: A review of ethiopathogenesis. Experimental and clinical studies and factors for prevention. Ophthalmology, 2004;52 : [5] Hayashi K., Hayashi H., Posterior capsule opacification in the presence of an intraocular lens with a sharp versus rounded optic edge, Ophthalmology, 2005; 112 : [6] Larkin H., PCO and premium lens, Eurotimes, 2012; 17(5): 4-6 Semantic Interoperability in Biomedicine and Healthcare
121 Slovák D., Zvárová J. DNA in Biomedical Applications 45 DNA in Biomedical Applications Dalibor Slovák 1,2, Jana Zvárová 1 1 Institute of Hygiene and Epidemiology, First Faculty of Medicine, Charles University in Prague, Czech Republic 2 Institute of Health Information and Statistics of the Czech Republic, Prague, Czech Republic Correspondence to: Dalibor Slovák Institute of Health Information and Statistics of the Czech Republic Address: Palackého nám. 4, Prague 2 E mail: dalibor.slovak@uzis.cz Aims of Research The use of DNA is now commonly accepted practice in the professional as well as non-professional public. It is used in many areas of criminology: the identification of the perpetrators of the crime, in paternity testing, in identification of victims of mass disasters and other cases. With the decreasing price of analyzes lately expand use of DNA analysis in many other ways: examination of historical remains, compiling family trees and searching and kinship ties, and also in biomedical aplications. State of the Art The first example of use in medical sciences is Huntington s chorea. Expansion in the number of trinucleotide repeat sequences in Huntington s chorea increases the probability of an unbalanced mental state. In serious crimes, it is possible to assess the sanity of the individual and his ability to control. As the state outside the norm is indicated the number of repetitive repetitions above 35. In the Czech population there is an innate tendency to increased blood coagulation (thrombophilia) relatively highly extended affects about 8 % of the population. Most risk group are women taking normal hormonal contraception which have genetic predisposition to increased coagulation. To prevent and minimize the problems associated with the development of thrombosis and thromboembolic disease it is important to know the genetic disposition, because an endangered person may appropriately adjust their diet and lifestyle on the basis of their knowledge of hereditary dispositions. Therefore, there is an analysis of thrombophilic mutations also in donors of gamets. The most common is factor V Leiden (G1691A), causing resistance of Factor V to anticoagulant activity of APC protein. One of the motivations for the development of personalized medicine is that the effect of some drugs can be affected by the genetic information of the patient, i.e. response of organism to drugs can be genetically determined. For physicians it is important to perform a test before starting treatment, or when considering the extension or change of treatment. One example is the VKORC1 gene, which has 24 known alleles. Two of them (CYP2C9-2, CYP2C9-3) enhance the anticoagulant effect of warfarin and reduce the daily doses needed to maintain an International Normalized Ratio (INR) in the therapeutic range. In the UGT1A1 gene is for carriers of allele 28 observed severe toxicity of Irinotecan, a drug used mainly to treatment of metastatic tumors of the colon and rectum. Application in Biomedicine and Healthcare DNA has two big advantages for testing. Human DNA consists of approximately 23,000 genes, some of which have yet more transcripts so characters usable for differentiation are even more. Identical entire genome have no two people in the world, not even identical twins. Second advantage of DNA is its omnipresence. DNA is present in every cell and remains in all places where we move. However, this advantage of easy availability can be a disadvantage at the same time. Due to the sensitivity of current techniques it is possible to analyze even a few cells. In analyzing such samples there are often found mixed DNA samples or contamination by impurities. In proportion to this there increases the importance of including all possible stochastic phenomena associated with laboratory processing to the calculation. Another problem of DNA analysis is a restriction on the selected part of genome. In forensic practice there is not evaluated the entire DNA, but so called DNA profile is compiled. One reason is the price: a human genome sequencing has cost less than 1 million dollars and is continuing to fall, but for routine analysis it is still a very high price. The second reason is the sensitivity of the information that can be obtained from DNA. Therefore, in more complex cases clear identification is not possible and it is necessary to use probabilistic models, including the Semantic Interoperability in Biomedicine and Healthcare
122 46 Slovák D., Zvárová J. DNA in Biomedical Applications various number of parameters. These models usually in some way calculate the probability of observing this DNA profile in the population. Because of the simplicity, some used models can ignore the parameters that may be crucial for the result, or may include these parameters to the calculation in a wrong way. From this there rise the mistakes that can fundamentally change the entire result of DNA analysis. As a memento, it is possible to note a case described in the article [1]: The authors took a mixed sample of DNA evidence from a real crime and presented it to 17 experienced analysts working in accredited government lab in the USA, without any contextual information that might bias their judgement. They reached opposing conclusions about whether the suspect matched the sample or not: only one analyst agreed with the original judgement that the suspect cannot be excluded. Four analysts said the evidence was inconclusive and 12 said he could be excluded. Subsequent survey of labs around the world also shows that there are significant inconsistencies in the guidelines on how to interpret a sample. As we can see, DNA analysis also has its risks. It is necessary to unify the terminology, improve and standardize probabilistic models and have respect to the guidelines. However, even then it will not be possible to completely eliminate the stochastic character of certain phenomena. Therefore, it is necessary to see DNA analysis as important, but not infallible tool of modern science. Acknowledgements This paper has been partially supported by the SVV project of Charles University in Prague. Keywords Deoxyribonucleic Acid Definition: A type of nucleic acid which is the basis of genetic information. Synonyms: DNA Reference: SNOMED CT: MeSH: D ICD10: not found DNA Analysis Definition: Procedure of forensic science that uses biological material containing DNA. Reference: SNOMED CT: MeSH: not found ICD10: not found Repetitive Sequence Definition: Multiply repeated sequence e.g. nucleotides in the DNA; they represent a large portion of human genome. Synonyms: Nucleic acid repetitive sequence Reference: SNOMED CT: MeSH: D ICD10: not found Thrombophilia Definition: Increased tendency to formation of blood clots. Reference: SNOMED CT: MeSH: D ICD10: D68.5 International Normalized Ratio Definition: The blood test used to assess correct dosage of anti-clotting drugs. Synonyms: INR, Standardized prothrombin time Reference: SNOMED CT: MeSH: D ICD10: not found References [1] Geddes L. Fallible DNA evidence can mean prison or freedom. New Sci. 2010; 207 (2773): 8-11 Semantic Interoperability in Biomedicine and Healthcare
123 Stonová M. Unstructured Data in Evidence-based Healthcare 47 Unstructured Data in Evidence-based Healthcare Michaela Stonová 1 1 First Faculty of Medicine, Charles University, Prague, Czech Republic Correspondence to: Michaela Stonová First Faculty of Medicine, Charles University, Prague, Czech Republic Address: Kateřinská 32, Prague E mail: Michaela.Stonova@lf1.cuni.cz Aims of Research The Holy grail of unstructured data analysis is an Automatic Diagnostic System (ADS). To achieve this ultimate goal a lot of consecutive steps must be done first. Understanding a Natural Language Processing (NLP) is one of them. During the NLP customisation to medical and local needs a by-product for a medical Big Data analysis was created[3]. Evidence-based Healthcare (EBH) and its subpart Evidence-base Medicine (EBM)[1] are heavily dependent on the ability to correctly assess vast amount of data. Narrative text representing 80 % of Electronic Medical Records (EMR) is a valuable source, yet still omitted due to its unstructured form. Acquired knowledge and skills from the NLP adjustment permitted to build a system for a Narrative Medical Records (NMR) analysis. State of the Art The NLP customisation is a real corner stone for analysis of unstructured data. Not only the language morphology, syntax and semantics must be incorporated, but also a high entropy medical jargon must be considered[7]. A prebuilt model was tested on EMRs from a Hospital Information System (HIS) of the Central Military Hospital Prague (CMHP). The testing records were obtained from various outpatient departments (e.g. emergency, cardiology, dermatology, ophthalmology, and so on). Patients records extracted directly from HIS databases were anonymized. Physician s and patient s names were erased and the National Identification Number was replaced by unique number, in this case the Patient s Number (PN).Thus privacy of all patients was protected, but the possibility to link relevant EMRs to a certain patient was maintained. The final format of each record was UTF-8 encoded text file following this semistructured form: 1 Based on ICD-10 code [4]. 2 Correct name for this facet is Medical Product database facet [6]. age;gender;patient;diagnosis 1 ;narrative text. 29;Male;675032;H353 ;Patient suffered... A median file size was 727 B. The file sizes oscillated between few bytes (the smallest file was only 26 B long containing just one word) and several kilobytes (the biggest over 15,3 kb) in a testing set. A total sum of all these testing text files was 1,6 GB. The medical records were processed in the Apache Lucene based system IBM Watson Content analytics. All input data were standardly crawled, parsed and indexed [5]. For a farther medical analysis these five special ad hoc categories (called facets) were created: - Age facet, - Gender facet, - Patient facet, - Diagnosis facet, - Drug facet. The Age facet contains sub-facets for each life decade, two special sub-facets for under aged and teen aged patient (both due to the fact, that CMHP is dedicated for adult patients) and one misfit category for new-borns and typing errors. The Gender facet distinguishes between male and female patients. The Patient facet shows all EMRs of a picked patient (based on the Patient s Number). The Diagnosis facet divides disease into 22 main groups and 276 subgroups according to its ICD-10 code [4]. The last Drug facet 2 represents the Anatomical Therapeutic Chemical (ATC) classification system, where the active substances are divided into different groups according to the organ or system on which they act and theirs therapeutic, pharmacological and chemical properties. The sub-facets copy a drugs division into fourteen main groups (1 st level), each with subsequent subgroups until the possible 5 th level. Based on the last two facets, the system is currently able to recognize and catalogue different diagnosis 3 The original number of registered items by the State institute for Drug Controll was almost The majority of drugs is produced by several pharmaceutical companies under the same name, so it was possible to lower the origin number to Semantic Interoperability in Biomedicine and Healthcare
124 48 Stonová M. Unstructured Data in Evidence-based Healthcare based on ICD-10 code[4] and medicinal products registered by the State institute for Drug Control, including e. g. the newest one in the L01X Antineoplastic and Immunomodulating Agent ATC group 4. During the processing, each word in the input text file is not only linguistically recognised, but also labelled if it belongs to a certain facet. All collateral information about each word are than stored in the Index, in our case in 69 files of total size 4,8 GB. Five added facets and standard NLP processing enriched the Index thus far, that indexed data are triple the origin size (1,6 GB). Once indexed data are easily visualised in the IBM Watson Content Analytics user interface. One click on corresponding facet reveals that from records, patients were men and were woman. The majority of them ( patients) have visited the outpatient department repeatedly, the rest of them only once ( patients). In total different outpatients have come to the CMHP and were treated for different diagnosis (according to its ICD-10 code). The previous results are also possible to obtain from a standard database due to the structured form of the first four parts of each EMR. Finding how many smoking patients were treated by other antineoplastic agents (L01X ATC group) for which diagnosis, is not the case. The information about smoking habits is generally stored in the narrative text, as a medication. Performing the content data analysis on unstructured data is the only feasible option. The basic Czech NLP allows to filter not only words in a base form as kuřák 5 or kuřačka 6 or kouřit 7, but also their inflexions 8. This NLP content analysis revealed smoking patients. Fifteen of them were treated by L01X ATC group drugs for various diagnosis (Table 1). Only 244 EMRs were labelled as alcohol-attributable disease (ICD-10 codes F100 and F102), but other 549 records explicitly mentioned that a patient was drunk in the narrative part of EMR. In total at least 793 patients were intoxicated (Table 2) 9. Table 2: Inebriated patients. The proposed system is designed for quick analysis 10 of unstructured data. System is able to deal with Big Data (up to several terabytes of data). After data crawling and indexing, the analysis can be performed instantly. The only limitation is medical language entropy. In some cases proposed system distorts the analysis. Prime example is shown in both tables. Scientific notations x10 in lab results (e.g. Thrombocytes: x10ˆ9/l) coincide 11 with the ICD-10 code X10 for a Contact with hot drinks, food, fats and cooking oils diagnosis. High number of X10 diagnosis in both cases is erroneous, but in the overall statistic is negligible. This type of distortion is more probable in short abbreviations, but also longer names like a ketoconazole can cause some misinterpretations. The ketoconazole can be both, an antifungal agent for topical use (D01AC08 ATC group) and a hormone suppressant (H02C ATC group). Which case is relevant depends on the context. Despite the fact, that mentioned faults have a minor impact on the statistic in the Big Data scope, the next step of research will be dedicated to its mitigation. Further research will focus on the content analysis improvement and a spelling error correction. Application in Biomedicine and Healthcare Table 1: Smoking patients. The number of patients coming to the policlinic in an inebriated state can be other task for the content analysis. on. 4 Especially monoclonal antibodies and various inhibitors. 5 A smoker. 6 A female smoker. 7 To smoke. 8 E.g. kouří, kouřil, kouřila, kuřácká, kuřákem, kuřácký and so The proposed analytic system is able to easily process terabytes of narrative medical records and is independent of data format. Therefore it can be used on various data sources without further customisation. The system is prepared for an automatic classification based on age, gender, 9 Table 2 shows only the diagnosis with at least ten occurrences. 10 To perform both smoking and drinking analysis took two minutes, including a results export to a csv file. 11 The system is deliberately case insensitive. Semantic Interoperability in Biomedicine and Healthcare
nské informatice Prof. RNDr. Jana Zvárová, DrSc. informatiku, nské informatiky Ústav informatiky AV ČR R v.v.i. http://www.euromise.
Vzdělávání v biomedicínsk nské informatice a ezdraví s podporou informačních a komunikačních technologií Prof. RNDr. Jana Zvárová, DrSc. Evropské centrum pro medicínskou informatiku, statistiku a epidemiologii
1. Definice a historie oboru molekulární medicína. 3. Základní laboratorní techniky v molekulární medicíně
Obsah Předmluvy 1. Definice a historie oboru molekulární medicína 1.1. Historie molekulární medicíny 2. Základní principy molekulární biologie 2.1. Historie molekulární biologie 2.2. DNA a chromozomy 2.3.
Štítná žláza v těhotenství
Štítná žláza v těhotenství Drahomíra Springer Ústav lékařské biochemie a laboratorní diagnostiky 1. LF UK a VFN Praha 23. září 2013 Fyziologické změny v těhotenství Během těhotenství dochází ke zvýšení
analýzy dat v oboru Matematická biologie
INSTITUT BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Komplexní přístup k výuce analýzy dat v oboru Matematická biologie Tomáš Pavlík, Daniel Schwarz, Jiří Jarkovský,
Výuka genetiky na Přírodovědecké fakultě UK v Praze
Výuka genetiky na Přírodovědecké fakultě UK v Praze Studium biologie na PřF UK v Praze Bakalářské studijní programy / obory Biologie Biologie ( duhový bakalář ) Ekologická a evoluční biologie ( zelený
Vzdělávání v Biomedicínské a Zdravotnické Informatice
Vzdělávání v Biomedicínské a Zdravotnické Informatice Prof. RNDr. Jana Zvárová, DrSc. EuroMISE Centrum Univerzity Karlovy a Akademie věd České republiky 1. LF UK a ÚI AV ČR Satelitní seminář EFMI STC 2013,
BIOMEDICÍNSKÁ INFORMATIKA A JEJÍ ÚLOHA V PERSONALIZOVANÉ MEDICÍNĚ
BIOMEDICÍNSKÁ INFORMATIKA A JEJÍ ÚLOHA V PERSONALIZOVANÉ MEDICÍNĚ Petr Lesný 1, Kryštof Slabý 1, Tomáš Holeček 2, Jan Vejvalka 1 1 Fakultní nemocnice v Motole, Praha 2 Fakulta humanitních studií UK, Praha
"Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Základy genetiky, základní pojmy
"Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Základy genetiky, základní pojmy 1/75 Genetika = věda o dědičnosti Studuje biologickou informaci. Organizmy uchovávají,
Mgr. et Mgr. Lenka Falková. Laboratoř agrogenomiky. Ústav morfologie, fyziologie a genetiky zvířat Mendelova univerzita
Mgr. et Mgr. Lenka Falková Laboratoř agrogenomiky Ústav morfologie, fyziologie a genetiky zvířat Mendelova univerzita 9. 9. 2015 Šlechtění Užitek hospodářská zvířata X zájmová zvířata Zemědělství X chovatelství
RIGORÓZNÍ OTÁZKY - BIOLOGIE ČLOVĚKA
RIGORÓZNÍ OTÁZKY - BIOLOGIE ČLOVĚKA 1. Genotyp a jeho variabilita, mutace a rekombinace Specifická imunitní odpověď Prevence a časná diagnostika vrozených vad 2. Genotyp a prostředí Regulace buněčného
Efektivní využití NIPT v rámci integrovaného screeningu chromozomálních aberací
Efektivní využití NIPT v rámci integrovaného screeningu chromozomálních aberací Jaroslav Loucký 1, Drahomíra Springer 2, Vladimír Gregor 3, David Čutka 4, Martin Hynek 5, David Stejskal 5 1 Prediko, Zlín
http://www.vrozene-vady.cz
Prevence vrozených vad z pohledu genetika MUDr. Vladimír Gregor, RNDr. Jiří Horáček odd. lékařské genetiky, Fakultní Thomayerova nemocnice v Praze Genetické poradenství Klinická genetika se zabývá diagnostikou
Tekuté biopsie u mnohočetného myelomu
Tekuté biopsie u mnohočetného myelomu Mgr. Veronika Kubaczková Babákova myelomová skupina ÚPF LF MU Pacientský seminář 11. května 2016, Brno Co jsou tekuté biopsie? Představují méně zatěžující vyšetření
Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/
Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/07.0354 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky Populační genetika (KBB/PG)
Zahrnutí alelického dropoutu
Sémantická interoperabilita v biomedicíně a zdravotnictví Mgr. Dalibor Slovák Oddělení medicínské informatiky a biostatistiky, ÚI AV ČR školitelka: Prof. RNDr. Jana Zvárová, DrSc. Ústav hygieny a epidemiologie,
Diagnostika genetických změn u papilárního karcinomu štítné žlázy
Diagnostika genetických změn u papilárního karcinomu štítné žlázy Vlasta Sýkorová Oddělení molekulární endokrinologie Endokrinologický ústav, Praha Nádory štítné žlázy folikulární buňka parafolikulární
BUNĚČNÁ TRANSFORMACE A NÁDOROVÉ BUŇKY
BUNĚČNÁ TRANSFORMACE A NÁDOROVÉ BUŇKY 1 VÝZNAM BUNĚČNÉ TRANSFORMACE V MEDICÍNĚ Příklad: Buněčná transformace: postupná kumulace genetických změn Nádorové onemocnění: kolorektální karcinom 2 3 BUNĚČNÁ TRANSFORMACE
Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled
Bioinformatika a výpočetní biologie KFC/BIN I. Přehled RNDr. Karel Berka, Ph.D. Univerzita Palackého v Olomouci Definice bioinformatiky (Molecular) bio informatics: bioinformatics is conceptualising biology
Nový bakalářský studijní obor Biomedicínská informatika na Fakultě biomedicínského inženýrství v Kladně
Fakulta biomedicínského inženýrství České vysoké učení technické v Praze Nový bakalářský studijní obor Biomedicínská informatika na Fakultě biomedicínského inženýrství v Kladně Zoltán Szabó Katedra biomedicínské
Biologie - Oktáva, 4. ročník (humanitní větev)
- Oktáva, 4. ročník (humanitní větev) Biologie Výchovné a vzdělávací strategie Kompetence k řešení problémů Kompetence komunikativní Kompetence sociální a personální Kompetence občanská Kompetence k podnikavosti
Elektronická zdravotní dokumentace
Elektronická zdravotní dokumentace Prof. RNDr. Jana Zvárová, DrSc. vedoucí Oddělení medicínské informatiky Ústavu informatiky Akademie věd ČR v.v.i., ředitelka EuroMISE centra UK a AV ČR Elektronická zdravotní
Vztah výpočetní techniky a biomedicíny
Vztah výpočetní techniky a biomedicíny počítač - nástroj pro vývoj nových přístrojů počítač -součást přístrojových systémů počítač - nástroj pro zpracování informací přispívá k metody, techniky a teorie
ELIXIR CZ Spolupráce velkých infrastruktur. Jiří Vondrášek, HoN ELIXIR CZ
ELIXIR CZ Spolupráce velkých infrastruktur Jiří Vondrášek, HoN ELIXIR CZ ELIXIR: Evropská infrastruktura pro biologická data Datová infrastruktura pro evropský výzkum ve vědách o živé přírodě: Data Interoperability
Biomedicínská informatika a její úloha v personalizované medicíně. Petr Lesný
Biomedicínská informatika a její úloha v personalizované medicíně Petr Lesný Co student medicíny ve škole nezíská Praktické dovednosti Empatii Schopnost práce s informacemi Lékařská informatika Schopnost
Přínos molekulární genetiky pro diagnostiku a terapii malignit GIT v posledních 10 letech
Přínos molekulární genetiky pro diagnostiku a terapii malignit GIT v posledních 10 letech Minárik M. Centrum aplikované genomiky solidních nádorů (CEGES), Genomac výzkumný ústav, Praha XXIV. JARNÍ SETKÁNÍ
Varianty lidského chromosomu 9 z klinického i evolučního hlediska
Varianty lidského chromosomu 9 z klinického i evolučního hlediska Antonín Šípek jr., Aleš Panczak, Romana Mihalová, Lenka Hrčková, Eva Suttrová, Mimoza Janashia a Milada Kohoutová Ústav biologie a lékařské
Metody studia historie populací. Metody studia historie populací
1) Metody studia genetické rozmanitosti komplexní fenotypové znaky, molekulární znaky. 2) Mechanizmy evoluce mutace, přírodní výběr, genový posun a genový tok 3) Anageneze x kladogeneze - co je vlastně
Vliv věku rodičů při početí na zdraví dítěte
Vliv věku rodičů při početí na zdraví dítěte Antonín Šípek Jr 1,2, Vladimír Gregor 2,3, Antonín Šípek 2,3,4 1) Ústav biologie a lékařské genetiky 1. LF UK a VFN, Praha 2) Oddělení lékařské genetiky, Thomayerova
Atestace z lékařské genetiky inovované otázky pro rok A) Molekulární genetika
Atestace z lékařské genetiky inovované otázky pro rok 2017 A) Molekulární genetika 1. Struktura lidského genu, nomenklatura genů, databáze týkající se klinického dopadu variace v jednotlivých genech. 2.
5 hodin praktických cvičení
Studijní program : Všeobecné lékařství Název předmětu : Lékařská genetika Rozvrhová zkratka : LGE/VC0 Rozvrh výuky : 5 hodin seminářů 5 hodin praktických cvičení Zařazení výuky : 4. ročník, 7., 8. semestr
Informace o studiu. Životní prostředí a zdraví Matematická biologie a biomedicína. studijní programy pro zdravou budoucnost
Informace o studiu Životní prostředí a zdraví Matematická biologie a biomedicína studijní programy pro zdravou budoucnost Proč RECETOX? Výzkumné centrum RECETOX poskytuje vzdělání v zajímavých oborech
Biologie - Oktáva, 4. ročník (přírodovědná větev)
- Oktáva, 4. ročník (přírodovědná větev) Biologie Výchovné a vzdělávací strategie Kompetence k řešení problémů Kompetence komunikativní Kompetence sociální a personální Kompetence občanská Kompetence k
Centrum aplikované genomiky, Ústav dědičných metabolických poruch, 1.LFUK
ové technologie v analýze D A, R A a proteinů Stanislav Kmoch Centrum aplikované genomiky, Ústav dědičných metabolických poruch, 1.LFUK Motto : "The optimal health results from ensuring that the right
OR Biomedicínská informatika
OR Biomedicínská informatika Předsedkyně oborové rady Prof. RNDr. Jana Zvárová, DrSc. Ústav informatiky Akademie věd ČR, v.v.i. Pod Vodárenskou věží 2 182 07 Praha 8 tel.: 266 053 640 fax: 286 581 453
FUNKČNÍ VARIANTA GENU ANXA11 SNIŽUJE RIZIKO ONEMOCNĚNÍ
FUNKČNÍ VARIANTA GENU ANXA11 SNIŽUJE RIZIKO ONEMOCNĚNÍ SARKOIDÓZOU: POTVRZENÍ VÝSLEDKŮ CELOGENOMOVÉ ASOCIAČNÍ STUDIE. Sťahelová A. 1, Mrázek F. 1, Kriegová E. 1, Hutyrová B. 2, Kubištová Z. 1, Kolek V.
Sylabus témat ke zkoušce z lékařské biologie a genetiky. Struktura, reprodukce a rekombinace virů (DNA viry, RNA viry), význam v medicíně
Sylabus témat ke zkoušce z lékařské biologie a genetiky Buněčná podstata reprodukce a dědičnosti Struktura a funkce prokaryot Struktura, reprodukce a rekombinace virů (DNA viry, RNA viry), význam v medicíně
6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života?
6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života? Pamatujete na to, co se objevilo v pracích Charlese Darwina a Alfreda Wallace ohledně vývoje druhů? Aby mohl mechanismus přírodního
Informace. v ceně života
Informace STAPRO s.r.o. Pernštýnské nám. 51 530 02 Pardubice v ceně života www.stapro.cz STAPRO s. r. o. Významný dodavatel a poskytovatel: - informačních systémů - zdravotnické techniky - služeb v oblasti
FN Olomouc je jedním ze 13 komplexních onkologických center v České republice, do kterých je soustředěna nejnáročnější a nejdražší
FN Olomouc je jedním ze 13 komplexních onkologických center v České republice, do kterých je soustředěna nejnáročnější a nejdražší superspecializovaná péče o pacienty se zhoubnými nádory. Na projekt modernizace
Výukový materiál zpracován v rámci projektu EU peníze školám
http://vtm.zive.cz/aktuality/vzorek-dna-prozradi-priblizny-vek-pachatele Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Eva Strnadová. Dostupné z Metodického portálu www.rvp.cz ;
Využití metod strojového učení v bioinformatice David Hoksza
Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace
Mgr. Veronika Peňásová vpenasova@fnbrno.cz Laboratoř molekulární diagnostiky, OLG FN Brno Klinika dětské onkologie, FN Brno
Retinoblastom Mgr. Veronika Peňásová vpenasova@fnbrno.cz Laboratoř molekulární diagnostiky, OLG FN Brno Klinika dětské onkologie, FN Brno Retinoblastom (RBL) zhoubný nádor oka, pocházející z primitivních
Novinky v klasifikaci NSCLC, multidisciplinární konsenzus. testování NSCLC
Novinky v klasifikaci NSCLC, multidisciplinární konsenzus 2012 pro molekulární testování NSCLC Radoslav Matěj Oddělení patologie a mol. medicíny Thomayerovy nemocnice, Praha Konsenzus Čestlice 25.6. 2010
ehealth, telemedicína a asistivní technologie na ČVUT FEL Praha
České vysoké učení technické v Praze Fakulta elektrotechnická ehealth, telemedicína a asistivní technologie na ČVUT FEL Praha Lenka Lhotská, Miroslav Burša, Michal Huptych, Jan Havlík Katedra kybernetiky,
MATEMATICKÁ BIOLOGIE
INSTITUT BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita MATEMATICKÁ BIOLOGIE Přírodovědecká fakulta Masarykova univerzita, Brno Studijní obor Matematická biologie Masarykova
Výuka telemedicíny a ehealth na 1. LF Univerzity Karlovy v Praze Centrum podpory aplikačních výstupů a spin-off firem 1. L F U K
Výuka telemedicíny a ehealth na 1. LF Univerzity Karlovy v Praze Centrum podpory aplikačních výstupů a spin-off firem L I B O R S E I D L, K A R E L H Á N A 1. L F U K 1 7. D U B N A 2 0 1 3 L É K A Ř
Inovace studia molekulární a buněčné biologie
Inovace studia molekulární a buněčné biologie Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. MBIO1/Molekulární biologie 1 Tento projekt je spolufinancován
Elektronický zdravotní záznam, sběr klinických údajů a klinické lékařské doporučení
Elektronický zdravotní záznam, sběr klinických údajů a klinické lékařské doporučení Mgr. Miroslav Nagy, Ph.D. Centrum Biomedicínské Informatiky Oddělení Medicínské Informatiky, UI AV ČR v.v.i. Seminář:
Ústav experimentální medicíny AV ČR úspěšně rozšířil přístrojové vybavení pro vědce z peněz evropských fondů
Ústav experimentální medicíny AV ČR úspěšně rozšířil přístrojové vybavení pro vědce z peněz evropských fondů Ústav úspěšně dokončil realizaci dvou investičních projektů s využitím prostředků z Operačního
Vyšetřování funkce štítné žlázy u těhotných Současný stav "pilotní studie" VZP D.Springer, T.Zima, Z.Límanová Ústav klinické biochemie a laboratorní diagnostiky 1. LF UK a VFN Praha 30. IAD 5.-7.dubna
Úvod do nonhla-dq genetiky celiakie
Úvod do nonhla-dq genetiky celiakie František Mrázek HLA laboratoř, Ústav Imunologie LF UP a FN Olomouc Celiakie - časté chronické zánětlivé onemocnění tenkého střeva s autoimunitní a systémovou složkou
Ošetřovatelský proces
Je těžké měnit lidi, ale je možné změnit systém práce v organizaci. J.Kersnik - Medical Tribune Ošetřovatelský proces Simona Saibertová LF, MU Ošetřovatelský proces je racionální vědecká metoda poskytování
Zeptejte se svého lékaře
Jednoduchý a bezpečný krevní test, který nabízí vysokou citlivost stanovení Neinvazivní test, který vyhodnocuje riziko onemocnění chromozomálního původu, jako je např. Downův syndrom, a nabízí také možnost
Pokročilé operace s obrazem
Získávání a analýza obrazové informace Pokročilé operace s obrazem Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno prezentace je součástí projektu FRVŠ č.2487/2011 (BFÚ LF MU) Získávání
CZ.1.07/1.5.00/34.0527
Projekt: Příjemce: Digitální učební materiály ve škole, registrační číslo projektu CZ.1.07/1.5.00/34.0527 Střední zdravotnická škola a Vyšší odborná škola zdravotnická, Husova 3, 371 60 České Budějovice
DIABETOLOGIČTÍ PACIENTI V REGIONECH ČESKA
DIABETOLOGIČTÍ PACIENTI V REGIONECH ČESKA Luděk Šídlo Boris Burcin 49. konference České demografické společnosti Demografie město venkov 23. května 2019, Lednice Příspěvek zpracován v rámci projektu TAČR
TELEMEDICÍNA. z řec. tele na dálku z lat. mederi léčení => medicína lékařství
TELEMEDICÍNA TELEMEDICÍNA z řec. tele na dálku z lat. mederi léčení => medicína lékařství výraz poprvé použit v 70. letech 20. stol. (Thomas Birde): jedná se o takový způsob poskytování zdravotní péče,
CEBO: (Center for Evidence Based Oncology) Incidence Kostních příhod u nádorů prsu PROJEKT IKARUS. Neintervenční epidemiologická studie
CEBO: (Center for Evidence Based Oncology) Incidence Kostních příhod u nádorů prsu PROJEKT Neintervenční epidemiologická studie PROTOKOL PROJEKTU Verze: 4.0 Datum: 26.09.2006 Strana 2 PROTOKOL PROJEKTU
Personalizovaná medicína Roche v oblasti onkologie. Olga Bálková, Roche s.r.o., Diagnostics Division Pracovní dny, Praha, 11.
Personalizovaná medicína Roche v oblasti onkologie Olga Bálková, Roche s.r.o., Diagnostics Division Pracovní dny, Praha, 11. listopadu 2013 Personalizovaná vs standardní péče Cílená léčba Spojení diagnostiky
Beličková 1, J Veselá 1, E Stará 1, Z Zemanová 2, A Jonášová 2, J Čermák 1
Beličková 1, J Veselá 1, E Stará 1, Z Zemanová 2, A Jonášová 2, J Čermák 1 1 Ústav hematologie a krevní transfuze, Praha 2 Všeobecná fakultní nemocnice, Praha MDS Myelodysplastický syndrom (MDS) je heterogenní
Pilotní projekt Optimalizace programu screeningu kolorektálního karcinomu
Národní koordinační centrum programů časného záchytu onemocnění CZ.03.2.63/0.0/0.0/15_039/0006904 Pilotní projekt Optimalizace programu screeningu kolorektálního karcinomu Ondřej Májek, Michaela Jelínková,
Dědičnost vázaná na X chromosom
12 Dědičnost vázaná na X chromosom EuroGentest - Volně přístupné webové stránky s informacemi o genetickém vyšetření (v angličtině). www.eurogentest.org Orphanet - Volně přístupné webové stránky s informacemi
Klasifikace vzácných onemocnění, Orphanet
Klinické klasifikace a jejich použití v českém zdravotnictví I. 8. listopadu, 2016 Emauzský klášter, Praha Klasifikace vzácných onemocnění, Orphanet prof. MUDr. Milan Macek jr., DrSc. Ústav biologie a
VĚDA A VÝZKUM V PERIOPERAČNÍ PÉČI. Mgr. Markéta Jašková Dana Svobodová Gynekologicko-porodnická klinika Fakultní nemocnice Ostrava
VĚDA A VÝZKUM V PERIOPERAČNÍ PÉČI Mgr. Markéta Jašková Dana Svobodová Gynekologicko-porodnická klinika Fakultní nemocnice Ostrava VĚDA A VÝZKUM NA GOS Detekce mutace genu BRCA1 a BRCA2, a to přímo z nádorové
Obr. 1 Vzorec adrenalinu
Feochromocytom, nádor nadledvin Autor: Antonín Zdráhal Výskyt Obecně nádorové onemocnění vzniká následkem nekontrolovatelného množení buněk, k němuž dochází mnoha různými mechanismy, někdy tyto příčiny
INOVATIVNÍ KURZY IMUNOANALÝZY A ENDOKRINOLOGIE PRO VĚDECKÉ PRACOVNÍKY- PILOTNÍ ZKUŠENOSTI LÉKAŘSKÉ FAKULTY V PLZNI
INOVATIVNÍ KURZY IMUNOANALÝZY A ENDOKRINOLOGIE PRO VĚDECKÉ PRACOVNÍKY- PILOTNÍ ZKUŠENOSTI LÉKAŘSKÉ FAKULTY V PLZNI RNDr. Marie Karlíková, PhD. Prof. MUDr. Ondřej Topolčan, CSc. Univerzita Karlova - Lékařská
Anotace. Klíčová slova. Zdravotnický portál pro občany - Dánsko
Alena Veselková, Pavel Kasal, Štěpán Svačina, Robert Fialka Zdravotnické portály pro občany Alena Veselková, Pavel Kasal, Štěpán Svačina, Robert Fialka Anotace V oblasti zdraví je důležitá dostupnost občana
EKONOMICKÉ ASPEKTY GENETICKÝCH VYŠETŘENÍ. I. Šubrt Společnost lékařské genetiky ČLS JEP
EKONOMICKÉ ASPEKTY GENETICKÝCH VYŠETŘENÍ I. Šubrt Společnost lékařské genetiky ČLS JEP Lékařská genetika Lékařský obor zabývající se diagnostikou a managementem dědičných onemocnění Genetická prevence
BIOINŽENÝRSTVÍ *) *) pracovní název pro nové studijní programy
BIOINŽENÝRSTVÍ *) *) pracovní název pro nové studijní programy příprava akreditace nových studijních programů bakalářský (zcela nový, nová pravidla NAÚ 16.2., začátek 2017? (2018?)) magisterský (nově pojatý,
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ
CO OBCE MOHOU UDĚLAT PRO GDPR UŽ NYNÍ?
CO OBCE MOHOU UDĚLAT PRO GDPR UŽ NYNÍ? Praha,1.února 2018 Mgr. Miroslava Sobková Svaz měst a obcí České republiky AKTUÁLNÍ OTÁZKY MENŠÍCH SAMOSPRÁV I. Úvod II. Stručný popis postupu při implementaci GDPR
Soulad studijního programu. Molekulární a buněčná biologie
Standard studijního Molekulární a buněčná biologie A. Specifika a obsah studijního : Typ Oblast/oblasti vzdělávání Základní tematické okruhy Kód Rozlišení Profil studijního Propojení studijního s tvůrčí
OPATŘENÍ DĚKANA č. 17/2018, kterým se vydává příkaz, kterým se mění Organizační řád 3. LF UK. Článek 1 Úvodní ustanovení
V Praze dne 29. 6. 2018 Č.j.: UK3LF/14959/2018-16 Počet listů: 2 Počet příloh: 1 OPATŘENÍ DĚKANA č. 17/2018, kterým se vydává příkaz, kterým se mění Organizační řád 3. LF UK Článek 1 Úvodní ustanovení
3. Výdaje zdravotních pojišťoven
3. Výdaje zdravotních pojišťoven Náklady sedmi zdravotních pojišťoven, které působí v současné době v České republice, tvořily v roce 2013 více než tři čtvrtiny všech výdajů na zdravotní péči. Z pohledu
Proč se nemocnice musí změnit
17. 18. května 2018 Proč se nemocnice musí změnit MUDr. Pavel Hroboň, M.S. Advance Healthcare Management Institute ČESKÁ REPUBLIKA 2 Obsah této prezentace Proč se nemocnice musí změnit? Hlavní změny a
Časný záchyt chronické obstrukční plicní nemoci v rizikové populaci
Časný záchyt diabetické retinopatie a makulárního edému u pacientů s diabetem 1. nebo 2. typu CZ.03.2.63/0.0/0.0/15_039/0008165 Časný záchyt chronické obstrukční plicní nemoci v rizikové populaci PreVon
JEDINEČNÁ INFORMACE. Jediný prenatální krevní test, který analyzuje všechny chromozomy vašeho miminka
JEDINEČNÁ INFORMACE Jediný prenatální krevní test, který analyzuje všechny chromozomy vašeho miminka MaterniT GENOME test nabízí více informací o chromozomech vašeho miminka než kterýkoliv jiný prenatální
Pavel Souček Úplný výkaz pedagogické činnosti
4. ÚPLNÝ VÝKAZ PEDAGOGICKÉ ČINNOSTI A. Pedagogická činnost 2004/2005 Pavel Souček, CSc. přímo vyučující pedagog (16 studentů) 2005/2006 Pavel Souček, CSc. přímo vyučující pedagog (4 studenti) 2006/2007
OBOROVÁ RADA BIOCHEMIE A PATOBIOCHEMIE
OBOROVÁ RADA BIOCHEMIE A PATOBIOCHEMIE Předseda: Stanislav Štípek, prof., MUDr., DrSc. Ústav lékařske biochemie a laboratorní disgnostiky 1. LF UK Kateřinská 32, 121 08 Praha 2 tel.: 224 964 283 fax: 224
,, Cesta ke zdraví mužů
PREZENTACE VÝSLEDKŮ ŘEŠENÍ PILOTNÍHO PROJEKTU PREVENTIVNÍ PÉČE PRO MUŢE,, Cesta ke zdraví mužů prim. MUDr. Monika Koudová GHC GENETICS, s.r.o.- NZZ, Praha Projekt byl realizován ve dvou etapách: I. etapa
Nová podoba Národního registru vrozených vad (NRVV)
Nová podoba Národního registru vrozených vad (NRVV) Seminář: Vzácné nemoci - terminologie, klasifikace, kódování Jitka Jírová, Ústav zdravotnických informací a statistiky ČR Národní registr vrozených vad
BMII. B i o m e d i c a l D a t a P r o c e s s i n g G r o u p
BMII České vysoké učení technické v Praze Fakulta elektrotechnická Magisterský program Biomedicínské inženýrství a informatika na ČVUT FEL Praha Olga Štěpánková (Kat.kybernetiky), step@labe.felk.cvut.cz
Formalizované klinické doporučené postupy s datovou a procesní složkou
Formalizované klinické doporučené postupy s datovou a procesní složkou Miroslav Zvolský Brainstormingový seminář Formalizace biomedicínských znalostí, 16. 6. 2014, Faustův dům Klinické doporučené postupy
"Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Molekulární základy genetiky
"Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Molekulární základy genetiky 1/76 GENY Označení GEN se používá ve dvou základních významech: 1. Jako synonymum pro vlohu
PREVALENCE A KONKORDANCE HPV V PÁRECH, VE KTERÝCH ŽENY MAJÍ GENITÁLNÍ BRADAVICE NEBO CERVIKÁLNÍ INTRAEPITELIÁLNÍ NEOPLAZII
PREVALENCE A KONKORDANCE HPV V PÁRECH, VE KTERÝCH ŽENY MAJÍ GENITÁLNÍ BRADAVICE NEBO CERVIKÁLNÍ INTRAEPITELIÁLNÍ NEOPLAZII MUDr. FILIP ROB, Ph.D. RNDr. Ruth Tachezy, Ph.D., MUDr. Tomáš Pichlík, MUDr. Petr
Příloha I. Vědecké závěry a zdůvodnění změny v registraci
Příloha I Vědecké závěry a zdůvodnění změny v registraci 1 Vědecké závěry S ohledem na hodnotící zprávu výboru PRAC týkající se pravidelně aktualizovaných zpráv o bezpečnosti (PSUR) jodidu-( 131 I) sodného
Aktivity ČLS JEP v oblasti ehealth
Česká společnost zdravotnické informatiky a vědeckých informací České lékařské společnosti Jana Evangelisty Purkyně Pracovní skupina pro elektronické zdravotnictví České lékařské společnosti Jana Evangelisty
Patient s hemato-onkologickým onemocněním: péče v závěru života - umírání v ČR, hospicová péče - zkušenosti jednoho pracoviště
Patient s hemato-onkologickým onemocněním: péče v závěru života - umírání v ČR, hospicová péče - zkušenosti jednoho pracoviště Jindřich Polívka 1, Jan Švancara 2 1 Hospic Dobrého Pastýře Čerčany 2 Institut
PROGRAMOVÉ PROHLÁŠENÍ
PROGRAMOVÉ PROHLÁŠENÍ Verze: 1.0 Datum: 03.05.2006 PROGRAMOVÉ PROHLÁŠENÍ CO je to CEBO? KDO FINANCUJE CEBO? PROČ je CEBO? CO DĚLÁ CEBO? Co a komu přinese CEBO? PACIENTI LÉKAŘI ČESKÁ REPUBLIKA Kvalitnější
GENETIKA 1. Úvod do světa dědičnosti. Historie
GENETIKA 1. Úvod do světa dědičnosti Historie Základní informace Genetika = věda zabývající se dědičností a proměnlivostí živých soustav sleduje variabilitu (=rozdílnost) a přenos druhových a dědičných
Národní akční plán pro vzácná onemocnění na léta 2015-2017
Národní akční plán pro vzácná onemocnění na léta 2015-2017 1. Zlepšení informovanosti o Cíle Úkoly Termín Výstupy Gestor Spolupráce Předpoklady 1.1. Provoz, rozvoj a aktualizace webových portálů pro ;
Národní akční plán pro vzácná onemocnění na léta
Národní akční plán pro vzácná onemocnění na léta 2015-2017 1. Zlepšení informovanosti o Cíle Úkoly Termín Výstupy Gestor Spolupráce Předpoklady 1.1. Provoz, rozvoj a aktualizace webových portálů pro ;
Využití a zneužití statistických metod v medicíně
Využití a zneužití statistických metod v medicíně Martin Hynek Gennet, Centre for Fetal Medicine, Prague EuroMISE Centre, First Faculty of Medicine of Charles University in Prague Statistika Existují tři
Aktuální hlediska a trendy v přístupu k vědeckým informacím a datům. David Novák Archeologický ústav AV ČR, Praha, v. v. i.
Aktuální hlediska a trendy v přístupu k vědeckým informacím a datům David Novák Archeologický ústav AV ČR, Praha, v. v. i. Zveřejňování informací v digitálním věku Demokratizace přístupu k informacím Zlom
Vytvořilo Oddělení lékařské genetiky FN Brno
GONOSOMY GONOSOMY CHROMOSOMY X, Y Obr. 1 (Nussbaum, 2004) autosomy v chromosomovém páru homologní po celé délce chromosomů crossingover MEIÓZA Obr. 2 (Nussbaum, 2004) GONOSOMY CHROMOSOMY X, Y ODLIŠNOSTI
KOLOREKTÁLNÍ KARCINOM: VÝZVA PRO ZDRAVÝ ŽIVOTNÍ STYL, SCREENING A ORGANIZACI LÉČEBNÉ PÉČE
KOLOREKTÁLNÍ KARCINOM: VÝZVA PRO ZDRAVÝ ŽIVOTNÍ STYL, SCREENING A ORGANIZACI LÉČEBNÉ PÉČE Brno, 29. května 2015: Moravská metropole se již počtvrté stává hostitelem mezinárodní konference Evropské dny
Hodnocení adresného zvaní občanů do screeningových programů v ČR
Datová základna realizace screeningových programů CZ.03.2.63/0.0/0.0/15_039/0007216 Hodnocení adresného zvaní občanů do screeningových programů v ČR Výsledky nad daty do 31.12. 2017 L. Dušek jménem kolektivu
Suchá krevní skvrna (Suchá krevní kapka, Dried Blood Spot)
Suchá krevní skvrna (Suchá krevní kapka, Dried Blood Spot) Kapka kapilární krve nanesena na testovací kartičku filtračního papíru a vysušena odběr z prstu ušního lalůčku z patičky (u novorozenců) odběrová
Studie EHES - výsledky. MUDr. Kristýna Žejglicová
Studie EHES - výsledky MUDr. Kristýna Žejglicová Výsledky studie EHES Zdroje dat Výsledky byly převáženy na demografickou strukturu populace ČR dle pohlaví, věku a vzdělání v roce šetření. Výsledky lékařského
Síť MEFANET a podpora výuky onkologie v klinické praxi
INSTITUT BIOSTATISTIKY A ANALÝZ Přírodovědecká a Lékařská fakulta, Masarykova univerzita, Brno, Česká republika Síť MEFANET a podpora výuky onkologie v klinické praxi L. Dušek, D. Schwarz Formy elektronické