MASARYKOVA UNIVERZITA. Barbora Hanáková



Podobné dokumenty
Co nás učí nádory? Prof. RNDr. Jana Šmardová, CSc. Ústav patologie FN Brno Přírodovědecká a Lékařská fakulta MU Brno

Personalizovaná medicína Roche v oblasti onkologie. Olga Bálková, Roche s.r.o., Diagnostics Division Pracovní dny, Praha, 11.

analýzy dat v oboru Matematická biologie

Přínos molekulární genetiky pro diagnostiku a terapii malignit GIT v posledních 10 letech

KOLOREKTÁLNÍ KARCINOM: VÝZVA PRO ZDRAVÝ ŽIVOTNÍ STYL, SCREENING A ORGANIZACI LÉČEBNÉ PÉČE

CZ.1.07/1.5.00/

BUNĚČNÁ TRANSFORMACE A NÁDOROVÉ BUŇKY

Evropský den onemocnění prostaty 15. září 2005 Aktivita Evropské urologické asociace a České urologické společnosti

Nádory trávicího ústrojí- epidemiologie. MUDr.Diana Cabrera de Zabala FN Plzeň Přednosta: Doc.MUDr.Jindřich Fínek,PhD.

Rakovina tlustého stfieva a koneãníku. Doc. MUDr. Jitka Abrahámová, DrSc. MUDr. Ludmila Boublíková MUDr. Drahomíra Kordíková

INTRACELULÁRNÍ SIGNALIZACE II

VĚDA A VÝZKUM V PERIOPERAČNÍ PÉČI. Mgr. Markéta Jašková Dana Svobodová Gynekologicko-porodnická klinika Fakultní nemocnice Ostrava

ONKOGENETIKA. Spojuje: - lékařskou genetiku. - buněčnou biologii. - molekulární biologii. - cytogenetiku. - virologii

Diagnostika genetických změn u papilárního karcinomu štítné žlázy

UPOZORNĚNÍ PRO STUDENTY

Život s karcinomem ledviny

Elementy signálních drah. cíle protinádorové terapie

1. Definice a historie oboru molekulární medicína. 3. Základní laboratorní techniky v molekulární medicíně

Modul obecné onkochirurgie

Biomarkery - diagnostika a prognóza nádorových onemocnění

FN Olomouc je jedním ze 13 komplexních onkologických center v České republice, do kterých je soustředěna nejnáročnější a nejdražší

Struktura a funkce biomakromolekul

Kongres medicíny pro praxi IFDA Praha, Hotel Hilton 27.září 2014

Toxické látky v potravinách s nebezpečím onkologické aktivace

Kolorektální karcinom (karcinom tlustého střeva a konečníku)

Neuroendokrinní nádory

7. Regulace genové exprese, diferenciace buněk a epigenetika

ProGastrin-Releasing Peptide (ProGRP) u nemocných s malobuněčným karcinomem plic

Pokyny pro vypracování bakalářských, diplomových a rigorózních prací na Přírodovědecké fakultě MU

NÁDOROVÁ RIZIKA. poznejme OBSAH

CORECT - VECTIBIX. Klinický registr pacientů s metastatickým kolorektálním karcinomem. Stav registru k datu

"Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Základy genetiky, základní pojmy

Opatření děkana č. 1/2012 Pokyny pro vypracování bakalářských, diplomových a rigorózních prací na Přírodovědecké fakultě MU

Beličková 1, J Veselá 1, E Stará 1, Z Zemanová 2, A Jonášová 2, J Čermák 1

Zhoubný novotvar kolorekta

BRNO KOMPLEXNÍ DOPRAVNÍ ANALÝZA

Epigenetika mění paradigma současné medicíny i její budoucnost

Testování biomarkerů u kolorektálního karcinomu.

CT screening benefit vs. riziko

3. Výdaje zdravotních pojišťoven

Exprese genetického kódu Centrální dogma molekulární biologie DNA RNA proteinu transkripce DNA mrna translace proteosyntéza

Sylabus témat ke zkoušce z lékařské biologie a genetiky. Struktura, reprodukce a rekombinace virů (DNA viry, RNA viry), význam v medicíně

Grantové projekty řešené OT v současnosti

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Prof. MUDr. Jiří Vorlíček, CSc. Prof. MUDr. Jitka Abrahámová, DrSc. MUDr. Tomáš Büchler, PhD.

Protinádorová imunita. Jiří Jelínek

Specifická imunitní odpověd. Veřejné zdravotnictví

VÝZNAM REGULACE APOPTÓZY V MEDICÍNĚ

Buněčný cyklus. Replikace DNA a dělení buňky

Výskyt MHC molekul. RNDr. Ivana Fellnerová, Ph.D. ajor istocompatibility omplex. Funkce MHC glykoproteinů

TRÁVICÍ SOUSTAVA - TLUSTÉ STŘEVO

6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života?

NUKLEOVÉ KYSELINY. Základ života

Hodnocení a modelování populačních dat na příkladu epidemiologie vážných chorob: I. Analýza dat, princip predikcí.

Deoxyribonukleová kyselina (DNA)

Všechno co jste kdy chtěli vědět o onkologii, ale báli jste se zeptat. David Feltl Fakultní nemocnice Ostrava

Současné trendy v epidemiologii nádorů se zaměřením na Liberecký kraj

Karcinom žaludku. Výskyt

Mgr. Veronika Peňásová Laboratoř molekulární diagnostiky, OLG FN Brno Klinika dětské onkologie, FN Brno

Terapeutické klonování, náhrada tkání a orgánů

Huntingtonova choroba

Využití metod strojového učení v bioinformatice David Hoksza

RIGORÓZNÍ OTÁZKY - BIOLOGIE ČLOVĚKA

PET při stagingu a recidivě kolorektálního karcinomu

AUG STOP AAAA S S. eukaryontní gen v genomové DNA. promotor exon 1 exon 2 exon 3 exon 4. kódující oblast. introny

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/

Tekuté biopsie u mnohočetného myelomu

Onemocnění střev. Tento výukový materiál vznikl za přispění Evropské unie, státního rozpočtu ČR a Středočeského kraje. PhDr.

Obr. 1 Vzorec adrenalinu

Bakalářské práce. Magisterské práce. PhD práce

Mikromorfologická diagnostika bronchogenního karcinomu z pohledu pneumologické cytodiagnostiky

IV117: Úvod do systémové biologie

VÝBĚR A JEHO REPREZENTATIVNOST

IMUNOGENETIKA I. Imunologie. nauka o obraných schopnostech organismu. imunitní systém heterogenní populace buněk lymfatické tkáně lymfatické orgány

Mutace s dobrou prognózou, mutace se špatnou prognózou omezené možnosti biologické léčby pro onkologické pacienty

M ASARYKŮ V ONKOLOGICKÝ ÚSTAV Žlutý kopec 7, Brno

Cyklická neutropenie a její původ

LÉKAŘSKÁ VYŠETŘENÍ A LABORATORNÍ TESTY

2. Z následujících tvrzení, týkajících se prokaryotické buňky, vyberte správné:

Zhoubné nádory v roce 2004 Malignant neoplasms in 2004

Ilona Zajíčková, DiS. Barbora Kamencová, DiS.

CEBO: (Center for Evidence Based Oncology) Incidence Kostních příhod u nádorů prsu PROJEKT IKARUS. Neintervenční epidemiologická studie

Dědičnost vázaná na X chromosom

SSOS_ZD_3.10 Tlusté střevo

ve srovnání s eukaryoty (životnost v řádu hodin) u prokaryot kratší (životnost v řádu minut) na životnost / stabilitu molekuly mají vliv

Epidemiologická onkologická data v ČR a jejich využití

Metastatický renální karcinom Andrašina Tomáš

MODERNÍ VÝUKA ONKOLOGIE JAKO SOUČÁST NÁRODNÍHO ONKOLOGICKÉHO PROGRAMU. J. Vorlíček Česká onkologická společnost ČLS JEP

TNM KLASIFIKACE ZHOUBNÝCH NOVOTVARŮ (8. VYDÁNÍ) Jiří Novák Masarykův onkologický ústav, Brno

Graf 1. Vývoj incidence a mortality pacientů s karcinomem orofaryngu v čase.

MAMOGRAFICKÝ SCREENING V ČESKÉ REPUBLICE

Úloha protein-nekódujících transkriptů ve virulenci patogenních bakterií

ATOMOVÁ FYZIKA JADERNÁ FYZIKA

Informační brožura o RAKOVINĚ VAJEČNÍKŮ. Co je rakovina vajecníku?

Lékařská genetika a onkologie. Renata Gaillyová OLG a LF MU Brno 2012/2013

Elecsys SCC první zkušenosti z rutinní praxe. Ing. Pavla Eliášová Oddělení klinické biochemie Masarykova nemocnice v Ústí nad Labem

Biologická léčba karcinomu prsu. Prof. MUDr. Jitka Abrahámová, DrSc. Onkologická klinika 1.LF UK a TN KOC (NNB+VFN+TN)

Diagnostika infarktu myokardu pomocí pravidlových systémů

ÚVOD DO TRANSPLANTAČNÍ IMUNOLOGIE

Transkript:

MASARYKOVA UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA STUDIJNÍ PROGRAM: BIOLOGIE STUDIUM EXPRESE GENŮ SPECIFICKÝCH PRO BRAF MUTANTNÍ NÁDORY KOLOREKTA NAPŘÍČ RŮZNÝMI ČÁSTMI TLUSTÉHO STŘEVA U ČASNÝCH STUPŇŮ VÝVOJE KARCINOMU Barbora Hanáková Bakalářská práce Vedoucí: Mgr. Eva Budinská, Ph.D. Brno 2012

Bibliografický záznam Autor: Hanáková Barbora Přírodovědecká fakulta, Masarykova univerzita Institut biostatistiky a analýz Centrum pro výzkum toxických látek v prostředí Název práce: Studium exprese genů specifických pro BRAF mutantní nádory kolorekta napříč různými částmi tlustého střeva u časných stupňů vývoje karcinomu. Studijní program: Biologie Studijní obor: Matematická biologie Vedoucí práce: Mgr. Eva Budinská, Ph.D. Rok obhajoby: 2012 Počet stran: IX + 42 Klíčová slova: BRAF mutace, kolorektální karcinom, mnohonásobný klasifikátor top-skórujících párů, genová signatura, genová exprese

Bibliographic entry Author: Hanáková Barbora Faculty of Science, Masaryk University Institute of Biostatistics and Analyses Research Centre for Toxic Compounds in the Environment Title of thesis: Study of expression of genes specific for BRAF mutated colon tumours across different parts of colon in early phases of tumor development. Degree programme: Biology Field of study: Mathematical Biology Supervisor: Mgr. Eva Budinská, Ph.D. Year of defence: 2012 Number of Pages: IX + 42 Key words: BRAF mutation, colorectal cancer, multiple top-scoring pairs, gene signature, gene expression

Abstrakt Velkým problémem poslední doby je kolorektální karcinom, na jehož výzkum se vědci zaměřují. Studium na molekulární úrovni nám může pomoci pochopit procesy probíhající v buňkách nádoru a k odhalení heterogenity nádoru, která se nemusí projevit na histologické úrovni. Je známo, že mutace protoonkogenu BRAF, důležitého člena MAPK/ERK signální dráhy regulující růst a proliferaci buněk, se objevuje u nádorů, které ještě nejsou agresivní, čili nemetastazují. Konkrétně mutace V600E, kdy je valin na pozici 600 aminokyseliny zaměněn za kyselinu glutamovou, vede ke stálé aktivaci BRAF proteinu a ten pak nereaguje na fyziologickou regulaci a ve většině případů ani na léčbu inhibitory EGFR. Pacienti s touto mutací mají horší prognózu a včasné odhalení nádoru s touto mutací může zvýšit dobu jejich přežití. A právě studium změn v expresi genů u časných stádií vývinu nádoru by nám mohlo pomoct pochopit příčiny molekulárních změn vedoucích k agresivitě nádoru. Cílem této práce je na dostupných datových souborech prostudovat dynamiku změn v expresi genů typických pro BRAF mutantní nádory tlustého střeva v různých stádiích vývoje nádoru a stanovit, ve kterém období vývoje nádoru a v které části střeva dochází ke změnám exprese. Data, získaná z veřejně dostupných databází, obsahovala 303 pacientů, kterým byl odebrán vzorek bud normální tkáně, adenomu nebo karcinomu. V první fázi analýzy klasifikátor jsem zařadila 7,9% pacientů do třídy s fenotypem BRAF-like. Dále jsem definovala geny, které by mohly být specifické pro počáteční stádia vývoje nádoru. A v neposlední řadě jsem použila testování hypotéz ke zjištění, zda existuje rozdíl v genové expresi mezi normální tkání, adenomem a karcinomem. Klíčová slova BRAF mutace, BRAF V600E, kolorektální karcinom, mnohonásobný klasifikátor topskórujících párů, genová signatura, genová exprese

Abstract A big problem in recent years has been colorectal carcinoma and many scientists have focused on its research. Studies at a molecular level may help us understand the processes that are taking place in tumour cells. Also it may help us with the detection of heterogeneity in tumours, which may not occur at a histological level. As we know, the mutation of protooncogene BRAF appears in tumours that are not yet aggressive, which means that the cancer cells do not metastatize at that time. The protooncogene is an important part of the MAPK/ERK pathway, which regulates the growth and proliferation of cells. The mutation V600E in particular, where valin is in the position of 600 amino acid substituted by glutamic acid, leads to the permanent activation of the BRAF protein in the pathway. The cell does not respond to physiological regulation and in most cases neither to treatment by inhibitors of EGFR. Patients with this mutation have the worst overall survival rate and early detection of tumors with this mutation may increase their chances. The study of changes in gene expression in the early phases of tumour development can help us understand the causes of molecular changes that lead to aggressive tumours. The aim of this bachelor thesis is to demonstrate the dynamics of changes in the expression of genes that are typical for BRAF mutation in colorectal carcinomas. I will focus on the available datasets in the different phases of tumour development. After that, I will specify in which period of tumour development and in which part of the intestine the expression has been changed. Datasets that were obtained from the available database contained 303 patients from whom was taken a sample of normal tissue, adenom or carcinoma. Firstly in my analysis,i classified 7.9% of patients with the BRAF-like phenotype. Then, I defined genes that might be specific to the early phases of tumour development. Lastly, I used hypothesis testing to find if there are differences between normal tissue, adenoma and carcinoma in gene expression. Key words BRAF mutation, BRAF V600E, colorectal cancer, multiple top-scoring pairs, gene signature, gene expression

Prohlášení Prohlašuji, že jsem tuto bakalářskou práci vypracovala samostatně a všechny použité zdroje jsou citované v seznamu použité literatury a seznamu internetových zdrojů. Datum:.................................. Podpis:..................................

Poděkování Na tomto místě bych chtěla poděkovat vedoucí své bakalářské práce Mgr. Evě Budinské, Ph.D. za odborné vedení, rady a konzultace, které mi poskytla v průběhu vypracování mé bakalářské práce. Ráda bych také poděkovala své rodině za podporu a umožnění studia na vysoké škole.

Institut biostatistiky a analýz Lékařské a Přírodovědecké fakulty Masarykovy univerzity spolupracuje na organizačním zajištění výuky studijního oboru Matematická biologie s Centrem pro výzkum toxických látek v prostředí Přírodovědecké fakulty MU.

Obsah Seznam obrázků 2 Seznam tabulek 3 Úvod 4 1 Kolorektální karcinom 5 1.1 Diagnostika.................................. 6 1.2 Léčba..................................... 6 1.2.1 Biologická léčba........................... 7 1.3 Molekulární determinanty.......................... 7 1.3.1 MSI.................................. 7 1.3.2 p53.................................. 8 1.3.3 MAPK/ERK signální kaskáda.................... 8 1.3.4 KRAS................................. 10 1.3.5 BRAF................................. 10 2 Datové soubory a použité metody 12 2.1 Robustní vícerozměrný průměr (RMA).................... 12 2.2 Mnohonásobný klasifikátor top-skórujících párů (mtsp).......... 13 2.3 Testování hypotéz a korekce mnohonásobného porovnávání......... 14 3 Výsledky 15 3.1 Klasifikace BRAF mutantů.......................... 15 3.2 Levá vs. pravá strana střeva.......................... 18 3.3 Pilovitý adenom vs. nepilovité adenomy a karcinomy............ 25 3.4 Testování skóre................................ 27 4 Biologicko - medicínská interpretace výsledků 30 5 Diskuse 32 Závěr 33 Slovník základních pojmů 35 Seznam zkratek 36 Seznam použité literatury 37 A Geny použité ke klasifikaci 40

Seznam obrázků 1 Incidence a mortalita v České Republice (www.svod.cz).................................. 5 2 Základní schéma MAPK/ERK signální kaskády (www.nature.com)................................ 9 3 Graf ukazující rozdíly přežití u pacientů ve III. stádiu rakoviny (Popovici et al., 2012)............................... 11 4 Proužkové grafy pro páry genů u normální tkáně, adenomů a karcinomů.. 17 5 Proužkové grafy pro páry genů u normální tkáně, adenomů a karcinomů.. 21 6 Proužkový graf pro páry genů u pilovitých a nepilovitých polypů...... 25 7 Proužkový graf pro páry genů u pilovitých a nepilovitých polypů...... 26 8 Histogramy znázorňující rozložení skóre pro jednotlivé populace...... 28 9 Boxplot porovnání skóre pro jednotlivé populace.............. 29

Seznam tabulek 1 Popisná statistika................................ 12 2 32 párů genů pro identifikaci BRAF mutantů................... 14 3 Procento párů genů u jednotlivých typů tkání splňujících pravidlo G1 < G2.... 16 4 Počet pacientů v jednotlivých kategoriích.................... 18 5 Procento párů genů u jednotlivých typů tkání z levé strany střeva splňujících pravidlo G1 < G2.................................... 19 6 Procento párů genů u jednotlivých typů tkání z pravé strany střeva splňujících pravidlo G1 < G2.................................... 20 7 Procento párů genů u normální tkáně splňujících pravidlo G1 < G2 s ohledem na místo výskytu (řazeno dle p-hodnoty)....................... 22 8 Procento párů genů u adenomů splňujících pravidlo G1 < G2 s ohledem na místo výskytu (řazeno dle p-hodnoty).......................... 23 9 Procento párů genů u karcinomů splňujících pravidlo G1 < G2 s ohledem na místo výskytu (řazeno dle p-hodnoty).......................... 24 10 Procento párů genů u pilovitých adenomů a karcinomů splňujících pravidlo G1 < G2. 27 11 Tabulka 64 genů klasifikujících BRAF mutaci, jejich Entrez GeneID, anglický název a lokaci..................................... 42

Úvod Rakovina, v dnešní době jedno z nejčastějších onemocnění, vede mezi příčinami úmrtí lidí na celém světě. Výskyt této nemoci se každým rokem zvyšuje. Dle statistiky Světové zdravotnické organizace je každý rok diagnostikováno 12,7 miliónů lidí a až 7,6 milionů jich na rakovinu zemře. I přes velké pokroky ve výzkumu a léčbě zůstává jedním z nejvážnějších problémů. Časná diagnóza a léčba zvyšují prognózu přežití a proto je důležité vyvíjet stále nové diagnostické metody a léčebné postupy, které pomáhají lidem v boji proti této zákeřné nemoci. Jak již název této práce napovídá, zaměřila jsem se na studium mutace BRAF v kolorektálním karcinomu, nebot právě pacienti s touto mutací mají horší prognózu přežití. Ta je způsobena nejen tím, že nádory kolorekta se mohou vyvíjet dlouho skrytě a projevit se až v pokročilém stádiu, ale také tím, že nádory s BRAF mutací mají špatnou odezvu na léčbu. Odhalení nádoru v ranných stádiích může zvýšit šance na přežití pacientů. Cílem mé bakalářské práce tedy bylo na veřejně dostupných datových souborech prostudovat dynamiku změn v expresi genů, které byly stanovené jako dostačující pro klasifikaci BRAF mutace v nádorech tlustého střeva, v počátečních stádiích vývoje nádoru. Dále jsem zkoumala, ve kterém období vývoje a v které části střeva dochází ke změnám exprese. Tyto informace by v budoucnu mohly pomoci pochopit procesy, které probíhají v buňkách a příčiny molekulárních změn vedoucích k agresivitě nádorů. Uvedení do problematiky a zdůvodnění, proč je důležité se zabývat právě studiem BRAF mutace v nádorech tlustého střeva, je uvedeno v první kapitole. Druhá kapitola se věnuje výběru vhodných dat pro další analýzy a jejich popisem. V podkapitolách jsou pak popsané metody, které byly aplikované na data. Výsledky a jejich interpretace jsou pak uvedené v následující kapitole. Částí této kapitoly je testování hypotéz, zda existují rozdíly v genové expresi mezi normální tkání, adenomem a karcinomem. Ve čtvrté kapitole pak interpretuji výsledky z biologicko-medicínského hlediska. 4

1 KOLOREKTÁLNÍ KARCINOM 1 Kolorektální karcinom Kolorektální karcinom představuje druhý nejvyskytovanější nádor a České republice patři první místo ve frekvenci výskytu tohoto nádoru na světě. Na následujícím grafu (obr. 1) je možné pozorovat vývoj incidence a mortality rakoviny tlustého střeva a konečníku v České republice v jednotlivých letech. Obrázek 1: Incidence a mortalita v České Republice (URL 1) Tlusté střevo (intestinum crassum) je součástí trávicího ústrojí člověka. Tlusté střevo o délce asi 1,5 metru a šířce 5-7 centimetru se skládá z pěti oddílů. Začíná jako slepé střevo (interstinum caecum), jehož slepým výběžkem je apendix, pokračuje tračníkem vzestupným (colon ascendens), příčným (colon transversum) a sestupným (colon descendens). Konečným oddílem je konečník (intestinum rectum). Tlusté střevo se plní 4-8 hodin po požití potravy a neprodukuje žádné trávící enzymy. Hlavní funkcí tlustého střeva je vstřebávání solí a vody. Zhoubné nádory vznikají nekontrolovatelným množením abnormálních buněk. Za normálních okolností se jednotlivé buňky množí podle určitých pravidel v momentě, kdy je tělo potřebuje, a nové buňky nahrazují staré buňky. Rakovinotvorné buňky dále neodpovídají na signály, které řídí růst, dělení a smrt buněk. Nádory můžou být benigní nebo maligní. Benigní nádory, neboli nezhoubné, nepronikají do okolní tkáně a ani se nešíří do jiných částí těla. Většinou jsou odstraněny a nepředstavují ohrožení života. Typickým benigním nádorem tlustého střeva je polyp. Polyp je výrůstek z membrány sliznice tlustého střeva, který vyrůstá nad úroveň střevní sliznice. Kolorektální polyp by měl být odstraněn, protože se může proměnit ve zhoubný nádor. Dle mikroskopického složení se rozlišují čtyři druhy polypů tzv. tubulární adenom, vilózní adenom, z něhož vzniká ve 30 % zhoubný nádor, a hyperplastický polyp, který je považovaný za benigní léze. Avšak pilovitý adenom, histologická varianta hyperplastického polypu, představuje riziko maligního zvratu. Maligní, zhoubné, nádory mohou postihovat i okolní tkáně a orgány a zároveň se mohou šířit krevním oběhem či lymfatickým systémem do jiných částí organismu. Takhle vzniklým druhotným nádorovým ložiskům říkáme metastáze. Mezi vlivy vzniku rakoviny tlustého střeva patří především strava. Negativní vliv má zvýšený podíl živočišných tuků v potravě, vysoká spotřeba červeného masa zpracovaného 5

1 KOLOREKTÁLNÍ KARCINOM smažením a uzením, nízký obsah vlákniny a rostlinných tuků. Dalšími rizikovými faktory je pití alkoholu a kouření. Za určitých podmínek mohou být rizikové i klimatické podmínky a znečištění životního prostředí. Zhruba 75% kolorektálních nádorů není dědičná a je způsobena somatickými mutacemi (URL 3). Mezi dědičné nádory patří familiární adenomatózní polypóza. Toto onemocnění se vyskytuje již v poměrně nízkém věku. V tlustém střevě pacienta se objevuje velké množství polypů, které se mohou zvrhnout v maligní karcinom. Jediným možným řešením je průběžné sledování a odstraňování polypů. Onemocnění je způsobeno mutací genu APC (z anglického Adenomatous polyposis coli). Závažným dědičným onemocněním je také Lynchův syndrom. U nemocného vzniká kolorektální karcinom bez předchozího vzniku polypů. V případě Lynchova syndromu II se vyskytují i další nádory, jako například žaludku, pankreatu a kůže. Nejčastější příčinou vzniku tohoto syndromu jsou mutace genů způsobujících mikrosatelitní nestabilitu. Kolorektální karcinom se může v těle vyvíjet několik měsíců. Hlavní nebezpečí spočívá v tom, že jeho vývoj může probíhat poměrně dlouho skrytě a projeví se až v pokročilém stádiu. Pacienti, kteří byli léčeni z kolorektálního karcinomu, musí pravidelně docházet na kontroly. Prognóza přežití v raných stádiích karcinomu je dobrá, pacienti se v 55-85% případů dožívají 5 a více let (URL 13). Při diagnóze pokročilých stádií je prognóza velmi špatná, medián přežití je 11 měsíců (Yokota et al., 2011). 1.1 Diagnostika Rentgenové vyšetření a kolonoskopie jsou dvě metody, které se používají pro diagnostiku rakoviny. V případě rentgenového vyšetření se používá tzv. metoda dvojitého kontrastu. Kontrastní látka s obsahem barya se vpraví do tlustého střeva. Ke zlepšení přehlednosti povrchu sliznice se provádí rozšíření střeva pomocí vzduchu. Lékař pak může na rentgenových snímcích pozorovat změny ve střevě. Kolonoskopie je vyšetření sliznice a vnitřních částí tlustého střeva pomocí endoskopického přístroje. Nalezený polyp je pak možné odstranit celý nebo jeho část pomocí rektoskopu nebo kolonoskopu. Odebraná tkáň se testuje na přítomnost maligních nádorů. Tento postup se nazývá biopsie. V případě zjištění zhoubného nádoru se provádí ultrazvuk nebo CT vyšetření jater či plic za účelem zjištění metastází. Dále se stanovují nádorové markery CEA a CA 19-9 z krve. Tyto látky jsou vylučované do oběhu nádorovou tkání. Léčba pak závisí na velikosti a lokalizaci nádoru, stádiu onemocnění a celkovém stavu pacienta. 1.2 Léčba Nejběžnějším způsobem léčby rakoviny tračníku a konečníku je chirurgický zákrok, kdy dojde k odnětí postižené části střeva a také okolní lymfatické uzliny, jejichž histologické vyšetření určí stádium nemoci. V případě zasažení uzlin nádorovými buňkami je nutná další léčba, nebot riziko šíření nádoru lymfatickým systémem je vysoké. Tento stav vede k nasazení chemoterapie, kdy jsou pacientovi většinou nitrožilně podávané speciální látky. Obvykle se používá kombinace látek 5-fluorouracil a leukovorin. Dalším léčebným postupem je radioterapie. Principem radioterapie je ozáření tumoru paprsky s vysokou energií, které poškozují nádorové buňky a zabraňují jejich růstu a dělení. Radioterapie se provádí ojediněle, zpravidla před chirurgickým zákrokem, ke zmenšení objemu tumoru a tím usnadňuje jeho odstranění, protože střevo je příliš citlivé na záření. 6

1 KOLOREKTÁLNÍ KARCINOM 1.2.1 Biologická léčba Poměrně novým druhem léčby v onkologii je tzv. biologická léčba, známá také jako cílená léčba.vyjímečnost většiny druhů biologické léčby tkví v podpoře imunitního systému lidského organismu tak, aby se s nemocí co nejlépe vypořádal sám. Účinek biologické léčby je velmi specifický a tudíž výrazně omezuje její nežádoucí účinky, které jsou mírnější a méně časté než v případě jiných léčebných metod. Jako příklady bych jmenovala horečku, zimnici, nevolnost či ztrátu chuti. Biologická léčba brání nádoru se šířit do dalších částí těla, napomáhá imunitnímu systému ničit nádorové buňky a především blokuje nebo snižuje účinek růstových faktorů podporujících růst nádorových buněk. Avšak přesné mechanismy biologické léčby, která podporuje lidský organismus v boji proti nádorům, nejsou známy. Používané látky se nazývají modifikátory imunitní odpovědi a ve většině případů se jedná o látky, které lidské tělo normálně vyrábí, ale u cílené léčby nádorů jsou tyto látky uměle vyrobené a tělu dodávané. Největší pozornost v poslední době směřuje na EGFR (receptor pro epidermální růstový faktor), transmembránový receptor, který je zahrnutý v buněčné proliferaci a růstu. Navázání ligandů na extracelulární doménu receprotu aktivuje dimerizaci receptoru a následnou autofosforylaci a aktivaci signální dráhy vedoucí k syntéze DNA a proliferaci buňky. Proto se nové způsoby biologické léčby zakládají na extracelulární nebo intracelulární blokaci tohoto receptoru. Jeho zablokování vede k inhibici signální kaskády a tím i k inhibici růstu nádorových buněk. Intracelulární nízkomolekulární inhibitory procházejí buněčnou membránou a následně dochází k vazbě s ATP vazebným místem tyrozinkinázové domény. Tyrozinkinázové inhibitory EGFR jsou méně specifické než monoklonální protilátky využívané při extracelulární blokaci, jelikož mohou inhibovat i jiné tyrozinkinázové cesty, které ovlivňují normální buněčné funkce. Monoklonální protilátky jsou vysokomolekulární, a proto neprocházejí buněčnou membránou. Tyto protilátky se slučují s extracelulární doménou EGFR, čímž zabrání navázání ligandu a naslednými ději dochází k degradaci EGFR. Monoklonální protilátky rovněž dokážou aktivovat na protilátkách závislou schopnost buněk ničit nádorové buňky. 1.3 Molekulární determinanty Zároveň s klasickými klinickými projevy se sledují další specifické charakteristiky nádorů tlustého střeva, které lékařům pomáhají s vhodným zvolením léčby. Konkrétně se jedná o mutace, především proteinů BRAF a KRAS, které neodpovídají na biologickou léčbu inhibice EGFR. Tyto mutace se nikdy nevyskytují v nádorech společně. Dalším specifickým znakem je mutace tumor supresorového proteinu p53, který má za následek většinu lidských nádorů. Velmi důležitým faktorem v molekulární identifikaci nádorů tlustého střeva je analýza mikrosatelitní nestability. Poslední neméně důležitou charakteristikou je určení lokace střeva, na které se nádor objevil, protože se vývojově jedná o dva rozdílné typy tkáně a je dokázané, že levá a pravé strana střeva má odlišnou genovou expresi. 1.3.1 MSI Mikrosatelity jsou sekvence DNA, které se skládají z polymorfních tandemových repeticí dvou až šesti nukleotidových párů. Tyto sekvence snadno podléhají mutacím při replikaci DNA. Dochází k inzercím nebo delecím vlivem snadnějšího sklouzávání DNA polymerázy. Pokud se v nádorové tkáni jedince objeví delší nebo kratší sekvence mikrosatelitu, pak mluvíme o mikrosatelitní nestabilitě. Nestabilita je způsobena inaktivací DNA opravných mechanismů (MMR = mismatch repair proteins), které opravují chyby vzniklé při replikaci. 7

1 KOLOREKTÁLNÍ KARCINOM Známe tři typy stability mikrosatelitních sekvencí: MSS mikrosatelitní stabilita MSI-L s nízkou frekvencí nestability mikrosatelitů, vyskytuje se jeden nestabilní mikrosatelit MSI-H s vysokou frekvencí nestability mikrosatelitů, vyskytuje se dva a více nestabilních mikrosatelitů MSI se vyskytuje ve spojení s dědičným kolorektálním karcinomem bez výskytu polypů a u 12-15% ojedinělých karcinomů tlustého střeva (URL 3). Tumory s mikrosatelitní nestabilitou se vyskytují především ve vzestupném tračníku a ojediněle i v sestupném tračníku. Tyto nádory také zřídkakdy tvoří metastáze. Analýza MSI je velmi důležitá v molekulární diagnostice pacientů s onkologickým onemocněním, protože pacienti s kolorektálním karcinomem a vysokou mírou MSI (MSI-H) mají lepší prognózu oproti pacientům s mikrosatelitně stabilním (MSS) nádorem. 1.3.2 p53 Protein 53, zkráceně p53, je nádorový supresorový protein, který je kódovaný genem TP53. Tento gen se u člověka nachází na 17 chromozomu a obsahuje 20 kb DNA a 11 exonů, z toho jeden nekódující. Vrozené mutace tohoto genu jsou vzácným dominantním onemocněním nazývaným Li-Fraumeniho syndrom, díky kterému se může vyvinout některý z nádorů. Inaktivací obou kopií genu TP53 vznikají somatické mutace, které mají za následek většinu lidských nádorů. Protein p53 má klíčovou úlohu v buněčné odpovědi na stres. V buňkách s poškozenou DNA hladina proteinu výrazně narůstá, zatímco v normálních buňkách je hladina nízká. P53 má také důležitou roli ve spouštění protirakovinných mechanismů. Protein dokáže aktivovat proteiny opravující DNA v případě trvalého poškození DNA, a také dokáže zastavit růst buňky v průběhu buněčného dělení ve fázi G1/S. Dále p53 dokáže spustit programovanou smrt buňky, tzv. apoptózu, pokud je DNA v buňce nevratně poškozena. P53 je dlouhý transkripční faktor složený ze tří domén. První doménou je N-koncová transkripčně aktivační doména (TAD) dlouhá 42 aminokyselin. Další je centrální DNAvazebná doména (DBD) dlouhá 177 aminokyselin, pro kterou jsou typické recesivní mutace způsobující ztrátu funkce. Tyto mutace poškozují nebo dokonce odstraňují schopnost proteinu vázat specifické sekvence DNA nacházející se v jeho cílových genech a tím dojde k znemožnění aktivace transkripce daných genů. Poslední doménou je C-koncová homooligomerizační doména (OD) dlouhá 30 aminokyselin. Molekuly p53 s dominantně negativní mutací, která je typická pro tento úsek, tvoří tetramery se standardními polypeptidy p53, které zabraňují standardním polypeptidům fungovat jako transkripční aktivátory. U více jak 50% případů kolorektálního karcinomu se jedná o mutaci tohoto genu a koreluje s horší prognózou (URL 3). 1.3.3 MAPK/ERK signální kaskáda MAP kinázová signální kaskáda se řadí do protein kinázových kaskád, které hrají důležitou roli v signálním přenosu ve všech eukaryotických buňkách z receptoru na povrchu buňky až do jádra buňky. Základní jednotkou této cesty je skupina proteinů serin/treonin kináz nazývaných MAP kinázy (mitogenem aktivovaná protein kináza), které jsou nejčastěji aktivovány růstovými signály nebo jinými signálními molekulami. V buňkách člověka jsou MAP 8

1 KOLOREKTÁLNÍ KARCINOM kinázy všudypřítomné regulátory, které mohou přidáním fosfátové skupiny na sousední protein vyvolat zastavení nebo šíření signálu řídícího růst buněk a diferenciaci. Mutace jednoho z proteinů v kaskádě může vést k nekontrolovatelnému dělení buněk a tvorbě buněk nádorových. Nejlépe popsaná část MAP kináz v buňkách člověka patří do ERK skupiny (z anglického extracellular signal-regulated kinase). Aktivace ERK má důležitý význam v signalizaci proliferace. Aktivace ERK je zprostředkovaná dvěma protein kinázami Grb2 a SOS, které jsou spojené k receptoru pro růstový faktor. Fosforylací receptoru se signál začne šířit přes Grb2 a SOS až ke G proteinu Ras (například protein KRAS), který vytvoří vazbu s GTP (guanosintrifosfát) a dojde k jeho aktivaci. Aktivace Ras dále vede k aktivaci Raf proteinu, který fosforyluje a aktivuje další protein kinázu nazývanou MEK. MEK pomocí fosforylace treoninového a tyrozinového zbytku aktivuje další členy z ERK skupiny. Fosforylovaný ERK vstupuje do jádra a aktivuje transkripční faktory řídící růst a diferenciaci buňky. Obrázek 2: Základní schéma MAPK/ERK signální kaskády (URL 5) Hlavní roli v ERK signální kaskádě plní Ras protein, který jak ukázaly studie, byl prvním identifikovaným onkogenem tumorových virů (zkratka pochází z anglického rat sarcoma virus). Experimenty ukazující důležitost Ras ve vnitrobuněčné signalizaci zjistily, že malé množství aktivovaného Ras proteinu přímo indukuje proliferaci buněk. Ras není pouze schopný navodit abnormální růst typický pro nádorové buňky, ale je také potřebný pro odpověd zdravých buněk na stimulaci růstového faktoru. Funkcí Ras proteinů, spojených guaninovými nukleotidy, je střídavě inaktivovat GDP vazby a aktivovat GTP vazby. Aktivita Ras-GTP komplexu je ukončena hydrolýzou GTP, která je podnícena vzájemným působením Ras-GTP komplexu, proteinem aktivovaným enzymem GTP fosfohydrolázou. Enzym hydrolyzuje guanosintrifosfát (GTP) na guanosindifosfát (GDP). Důležité je zmínit, že mutace Ras genů u nádorů inhibují GTP hydrolýzu. Tyto zmutované Ras proteiny setrvávají po celou dobu v aktivované vazbě s GTP a řídí neregulovatelnou proliferaci rakovinných buněk, i když chybí růstový faktor. 9

1 KOLOREKTÁLNÍ KARCINOM 1.3.4 KRAS KRAS (z anglického Kirsten rat sarcoma viral oncogene homolog) je protein s GTPázovou aktivitou, který se účastní přenosu signálu od aktivovaného receptoru pro růstové faktory na buněčném povrchu. Tento protein je kódovaný stejnojmenným genem, který se nachází na 12 chromozomu. Gen KRAS zabírající 35 kb je složen z 6 exonů. Substituce aminokyseliny nebo částečná substituce nukleotidů je zodpovědná za mutace, které vedou ke vznikům různých nádorových onemocnění. Mutace nejčastěji postihují 12 kodón genu KRAS a dále i 13 a 61. Mutace kodónu kódujícího aminokyselinu glycin, která jako jediná aminokyselina nemá postranní řetězec, na dvanácté pozici vede k zařazení jiné aminokyseliny s postranním řetězcem. Na základě studií bylo zjištěno, že pouze mutace glycinu za valin má významný dopad na vývoj kolorektálního karcinomu. Mutaci KRAS najdeme ve 25-50% výskytu rakoviny tlustého střeva (URL 3). 1.3.5 BRAF Serin/treonin-protein kináza je protein, který je v lidském organismu kódovaný BRAF onkogenem nacházejícím se na 7 chromozomu. Tento protein je důležitý v regulaci signální kaskády MAPK/ERK, která kontroluje důležité funkce buňky. Protein tedy pomáhá s chemickým šířením signálů z povrchu buněk do buněčného jádra a je zapojený i do regulace růstu buněk, proliferace a diferenciace. Mutace proteinu BRAF v signální kaskádě má horší dopad na pacienta než mutace KRAS proteinu, který lze v signální kaskádě obejít či nahradit. Mutace genu BRAF jsou spojovány s řadou nádorů. Více než 80 % mutací je způsobeno záměnou aminokyseliny valinu za kyselinu glutamovou na pozici 600 aminokyseliny. Tato mutace nese označení V600E. Záměna vede ke stálé aktivaci BRAF, protože stimuluje fosforylaci na T599 nebo S602 v aktivační doméně proteinu. Ten pak nereaguje na fyziologickou regulaci RAS. Tuto mutaci najdeme v 15 % případech kolorektálního karcinomu (Faris et al., 2012). Ve studii, na kterou má bakalářská práce navazuje, se Popovici et al. zabývali vývojem a stanovením BRAF mutantních genů v kolorektálním karcinomu a studiem jejich důsledků na prognózu. K dispozici měli genové exprese 668 pacientů ve II. a III. stádiu kolorektálního karcinomu. Vzorky tkání z vyoperovaných nádorů pacientů, kteří byli zařazeni do klinické studie PETACC-3 (z anglického Pan European Trial Adjuvant Colon Cancer-3), byly fixovány formalínem a zalité parafinem pro fixaci na delší dobu a purifikaci genetické informace. Cílem této práce bylo stanovit rozdíly v genové expresi vzorků s BRAF mutací V600E, bez BRAF mutace a bez KRAS mutace a vytvoření klasifikátoru BRAF mutace, který je založený na genové expresi. Na základě tohoto klasifikátoru, o kterém se podrobně zmíním později, bylo zjištěno, že více než 30% pacientů s mutací KRAS bylo klasifikováno jako BRAF mutantní, označovaní jako BRAF-like. BRAF-like populace vykazovala podobné rysy jako BRAF mutanti v klinickopatologickém obrazu, od vyšší frekvence výskytu slizovitých nádorů po status MSI. U těchto pacientů bylo také zjištěno horší přežití než u pacientů s KRAS mutací, kteří nebyli klasifikování jako BRAF mutantní. Na následujícím grafu (obr. 3) jsou pomocí Kaplan-Meierovy křivky přežití vidět rozdíly jak v celkovém přežití pacientů ve III stádiu rakoviny, tak u pacientů po relapsu. Tento nový klasifikační prostředek poskytuje biologické informace a může pomoci při určení léčebných strategiích u pacientů, protože jak již bylo zmíněno, BRAF mutace neodpovídá na klasickou léčbu EGFR inhibitory. 10

1 KOLOREKTÁLNÍ KARCINOM Obrázek 3: Graf ukazující rozdíly přežití u pacientů ve III. stádiu rakoviny (Popovici et al., 2012) 11

2 DATOVÉ SOUBORY A POUŽITÉ METODY 2 Datové soubory a použité metody Datové soubory obsahující záznamy z expresních mikročipů byly získány ze stránek European Bioinformatics Institute (URL 9) a National Center for Biotechnology Information (URL 10). Pro další analýzy je potřeba vybrat ty soubory, které obsahují záznamy z buněk normálních tkání, adenomů a časných stádií nádorů tlustého střeva. V následující tabulce (tab. 1) je základní popis datových souborů, které byly zvoleny jako vhodné pro další zpracování. Bohužel k expresním datům se informace o pohlaví a o věku často neuvažují, a proto reprezenatativnost populace nemůže být ověřena. V článku Popovici et al. je však uvedené, že tyto proměnné neovlivňuji vznik a vývoj mutace BRAF. Soubor N Pohlaví Průměrný Typ tkáně Počet GSE muži ženy věk normální adenom karcinom párů genů 12514 8 3 5 74 0 8 0 10 8761 63 - - - 32 31 0 28 10714 30 - - - 3 16 11 28 9254 19 - - - 19 0 0 28 4183 38 - - - 8 15 15 28 20916 105 51 54 63 24 45 36 28 4107 22 10 12 40 10 0 12 28 15960 18 - - - 6 6 6 28 4045 37 18 19-0 0 37 16 Tabulka 1: Popisná statistika Celkem do další analýzy vstupovalo 340 pacientů z nichž 102 pacientům byly odebrány vzorky normální tkáně, 121 vzorků bylo získáno z adenomu a 117 z karcinomu. Vzorky byly odebrány při biopsii nebo laserové mikrodisekci. Vzorky, které označuji jako normální tkáň se získávají se souhlasem pacienta z okolí nádorů nebo adenomů a nebo se jedná o tkáň získanou u pacientů s jiným problémem jako je například chronický zápal. Tato tkáň z histologického hlediska nevykazuje žádné změny. Datové soubory byly již znormalizované a to sice metodou robustního vícerozměrného průměru a dále jsem na ně aplikovala mnohonásobný klasifikátor top-skórujících párů založený na klasifikaci 64 genů. Oběma metodám se budu více věnovat v následujícíh oddílech této práce. Veškeré analýzy budou prováděny pomocí statistického softwaru R, verze 2.13.2. 2.1 Robustní vícerozměrný průměr Robustní vícerozměrný průměr (Robust Multiarray Average, zkráceně RMA) je metoda běžně využívaná k normalizaci genomických dat z Affymetrix čipů (Irizarry et al., 2003). Proces normalizace probíhá ve třech klíčových krocích: korekce pozadí, kvantilová normalizace a následná sumarizace. Při této metodě dojde nejprve k odečtení pozadí představující šum, který nám může ovlivnit intenzity skutečného signálu. Tato hodnota je odhadnutá ze všech MM (z anglického mismatch) sond. MM sondy mají délku 25-ti oligonukleotidových bazí. Dále je potřeba srovnat intenzity signálu mezi čipy pomocí kvantilové normalizace během níž dochází k transformaci dvou datových souborů tak, aby měly rozložení s identickými statistickými parametry. Počítá pouze s PM hodnotami (z anglického perfect match). PM 12

2 DATOVÉ SOUBORY A POUŽITÉ METODY sondy jsou dokonale spárované báze o délce 25 oligonukleotidových bází komplementárních s transkriptem a MM sondy se od nich liší tak, že 13. báze je komplementární k odpovídající bázi na PM sondě. Cílem je, aby kvantily všech vzorků byly stejné. Kvantilová normalizace je založena na pořadí a proto neexistují žádné předpoklady na rozložení dat. Posledním krokem je sumarizace. Jakmile je sonda zbavena šumu a znormalizovaná, je potřeba ji zesumarizovat do konečné hodnoty. Použitá sumarizace vychází z pozorování, že log-transformované PM hodnoty vyplývají z lineárního aditivního modelu, který se skládá z koeficientu afinity, logaritmované hodnoty skutečného signálu a nezávislé chyby. Výsledkem celého procesu normalizace je matice hladin genové exprese, kde v řádcích jsou jednotlivé geny a v sloupcích jednotlivé vzorky/pacienti. 2.2 Mnohonásobný klasifikátor top-skórujících párů Pro další zpracování dat bylo nutné vybrat vhodný postup na porovnávání a zařazení genů, které jsou typické pro BRAF mutantní nádory, do jednotlivých tříd, v tomto případě s mutací BRAF a bez mutace BRAF. V již několikrát zmiňovaném článku Popovici et al., byl autory navržen a použit mnohonásobný klasifikátor top-skórujících párů (multiple topscoring pairs, zkráceně mtsp), který s 96% sensitivitou a 86% specificitou dokáže zaznamenat nádor s mutací BRAF. Mnohonásobný klasifikátor top-skórujících párů využívá 32 párů genů, které byly zjištěny jako dostatečné pro identifikaci BRAF mutace v nádorové buňce. Tento klasifikátor vychází z již dříve vytvořeného klasifikátoru TSP (Geman et al., 2004) na předpovídání skupin a párové porovnávání dat z expresních microarrayí. Lépe řečeno, metoda se snaží najít rozdíly mezi dvěma třídami hledáním párů genů, jejichž hladina exprese typicky přechází z jedné třídy do třídy druhé. Výběr párů genů by se dal jednoduše popsat jako výběr dvou prvků z množiny 64 genů s opakováním. Při výběru záleží na pořadí prvků. Tímto způsobem se porovnají všechny možné páry genů a ke každému genu se spočítá skóre jako funkce z podílu správně klasifikovaných případů. Čili skóre je empirická pravděpodobnost odhadnutá jako procento případů, ve kterém je zachováno pravidlo, že exprese prvního genu je menší než exprese genu druhého u BRAF mutace a zároveň exprese prvního genu je větší než exprese druhého genu pro vzorky bez mutace. Tato pravděpodobnost se získává z testovacích dat. Páry byly seřazené na základě jejich skóre a následně vybrány ty, jejichž skóre nabývalo vyšších hodnot než 0,6. Hodnota 0,6 říká, že 60% případů bylo klasifikováno správně a tudíž je toto nejnižší možná hranice, pokud chceme zajistit robustnost a zároveň specificitu souboru. Dále byly z výběru vyřazené geny tak, aby vznikly pouze páry unikátní. To znamená, že se gen může vyskytovat jen na jedné pozici v jednom páru. Tímto způsobem vzniklo 32 párů genů, které jsou vypsány v tabulce 2. Rozhodovací pravidlo pro jeden pár genů je velmi jednoduché. Vzorek klasifikujeme jako BRAF mutantní pokud platí, že exprese prvního genu je nižší než druhého genu (G1 < G2). Jenže v případě více párů genů musíme dané pravidlo upravit a pro klasifikaci využít vlastností průměru, jakožto nejreprezentativnější míry. Díky tomu, že páry jsou vybrané podle určitého pravidla, pak všechny musí mít svůj podíl na koncové hodnotě, pokud exprese jednoho nebo více z genů nabývá extrémních hodnot, pak by tyto hodnoty měly ovlivnit celkové skóre. Vytvoříme si jednu množinu všech expresí prvních genů v 32 párech a druhou množinu, která bude obsahovat všechny exprese druhých genů. Pak za BRAF mutanty označíme ty vzorky, pro které bude platit, že průměrná exprese genů z první množiny je menší než průměrná exprese genů z druhé množiny (průměr GL < průměr GR). Ovšem ne vždy při analýzách je k dispozici všech 64 genů. Metoda byla aplikovaná i na datových souborech, které obsahovaly méně než těchto 32 párů genů. Na základě výsledků 13

2 DATOVÉ SOUBORY A POUŽITÉ METODY z těchto souborů bylo zjištěno, že klasifikátor funguje i s 8 páry genů. Pár# Gen 1 Gen 2 Pár# Gen 1 Gen 2 1 C13orf18 CTSE 17 VAV3 OSBP2 2 DDC AQP5 18 CFTR KLK10 3 PPP1R14D REG4 19 PHYH DUSP4 4 HSF5 RSBN1L 20 PLCB4 HOXD3 5 SATB2 RASSF6 21 ZNF141 C11orf9 6 TNNC2 CRIP1 22 PPP1R14C CD55 7 GGH PPPDE2 23 FLJ32063 TRNP1 8 SPINK1 PLK2 24 APCDD1 FSCN1 9 PTPRO TM4SF4 25 ACOX1 KIAA0802 10 ZSWIM1 MLPH 26 C10orf99 PLLP 11 RNF43 RBM8A 27 MIR142 IRX3 12 CELP SOX8 28 ARID3A SLC25A37 13 CBFA2T2 PIWIL1 29 C20orf111 PIK3AP1 14 PTPRD LOC388199 30 AMACR TPK1 15 CDX2 S100A16 31 AIFM3 ZIC2 16 TSPAN6 RBBP8 32 CTTNBP2 SERPINB5 Tabulka 2: 32 párů genů pro identifikaci BRAF mutantů 2.3 Testování hypotéz a korekce mnohonásobného porovnávání V neposlední řadě jsem testovala hypotézy. Nejprve jse testovala rozdíly v platnosti vztahů genů G1 < G2, který je specifický pro BRAF mutantní nádory kolorekta, mezi různými tkáněmi a mezi levou a pravou stranou střeva. Jelikož platnost vztahů pro jednotlivý pár genů jsem měla vyjádřenou v procentech, pak jsem používatla Pearsonův chí-kvadrát test. Následně jsem použila korekci mnohonásobného porovnávání, konkrétně Benjamini-Hochbergovu korekci. Dále jsem testovala rozdíly v genové expresi mezi normální tkání, adenomem a karcinomem. K tomuto testování jsem si vybrala Mann-Whitneyho test a opět jsem použila Benjamini-Hochbergovu korekci. Důvody, proč jsem se tozhodla pro tento test uvedu v podkapitole testování hypotéz. 14

3 VÝSLEDKY 3 Výsledky V následujících podkapitolách se budu věnovat výsledkům, které jsem získala po použití mtsp na každý pár genů u každého vzorku. Tyto výsledky rozdělím do tří skupin. Nejprve se zaměřím na interpretaci na celém souboru a pokusím se zjistit, ve kterém stádiu vývoje nádoru dochází ke změnám genové exprese a zda se dají definovat geny, které by mohly definovat BRAF mutaci v počátečních stádiích vývoje nádoru. Dále se podívám zda se liší exprese u nádorů, adenomů a normální tkáně v závislosti, na které straně střeva byla tkáň odebraná. V následující části se budu zabývat rozdíly mezi pilovitými a nepilovitými adenomy a karcinomy. V poslední části se budu věnovat testování skóre, zda je rozdíl mezi skóre normální tkáně, adenomu a karcinomu. 3.1 Klasifikace skupiny BRAF mutantů Na základě mtsp jsem predikovala 7 pacientů s karcinomem (8,75%), 14 pacientů s adenomem (11,57%) a 3 pacienty (2,94%), kterým byla odebraná normální tkáň, jako BRAF mutantní. Použitím TSP byly získány výsledky uvedené v následující tabulce, kde procenta uvedená v buňkách znamenají podíl párů, pro které platí pravidlo G1 < G2, v dané populaci. Výsledky jsem také znázornila graficky na obrázku 4. Ve 100% pro všechny tři typy tkáně bylo toto pravidlo zachované pro páry genů HSF5 < RSBN1L, ZSWIM1 < MLPH, CDX2 < S100A16 a ZNF141 < C11orf9. Taktéž pár TNNC2 < CRIP1 ve většině případů zachovává vztah genů G1 < G2. Naopak ani jednou pro všechny tři typy tkáně nebylo pravidlo zachováno v případě párů SATB2 < RASSF6 a CBFA2T2 < PIWIL1. Tyto výsleky bych mohla interpretovat tak, že tyto páry nejsou specifické pro BRAF mutanty, ale tento úsudek by byl chybný, protože skóre těchto párů bylo velmi vysoké, takže by měly být specifické. Problém by mohl být dán rozdíly v sondách a jejich specificitě k jednotlivým genům mezi platformami. Zatímco klasifikátor vznikal na datech platformy AL- MAC, já jsem ve své analýze používala Affymetrix. Těsně před odevzdáním této práce se na základě mých výsledků zjistilo, že některé z genů na platformě ALMAC měly špatnou anotaci. Při zaměření se na pacienty, u kterých při použití mtsp platil vztah genů specifických pro BRAF mutantní nádory, jsem pozorovala několik zajímavých výsedků i po použití TSP. U pacientů s normální tkání platil vztah G1 < G2 u párů SPINK1 < PLK2, TSPAN6 < RBBP8 a ACOX1 < KIAA0802 pouze pro pacienty, kteří byli na základě mtsp klasifikovaní jako BRAF mutantní. Stejné výsledky jsem pozorovala i u pacientů s karcinomem pro páry PHYH < DUSP4 a APCDD1 < FSCN1. Bohužel u adenomů nebyl zpozorován žádný takový vztah. Na základě tohoto pozorování jsem páry SPINK1 < PLK2, TSPAN6 < RBBP8 a ACOX1 < KIAA0802 určila jako specifické pro normální tkáň a páry PHYH < DUSP4 a APCDD1 < FSCN1 jako specifické pro nádorovou tkáň. Na základě výše zmíněných výsledků, které jsou zhrnuty v tabulce 3 a graficky zobrazeny na obrázku 4, usuzuji, že změny v expresi genů, typických pro BRAF mutantní nádory, nastávají již v normální tkáni a jsou pozorovatelné i v tkáni adenomu. 14 párů genů, které jsou specifické pro BRAF mutantní nádory, se vyskytuje v méně než 15%, což je výskyt BRAF mutantů v populaci s kolorektálním karcinomem, a další dva páry v méně než 30%, což je výskyt BRAF-like. 15

3 VÝSLEDKY Pár genů Normální tkáň Adenom Karcinom ZNF141 < C11orf9 100,0% 100,0% 100,0% CDX2 < S100A16 100,0% 100,0% 100,0% ZSWIM1 < MLPH 100,0% 100,0% 100,0% HSF5 < RSBN1L 100,0% 100,0% 100,0% TNNC2 < CRIP1 100,0% 100,0% 80,0% PPP1R14C < CD55 56,1% 92,6% 75,3% C20orf111 < IK3AP1 78,0% 41,6% 55,0% CTTNBP2 < SERPINB5 54,9% 94,3% 53,1% C13orf18 < CTSE 89,1% 69,8% 47,6% PPP1R14D < REG4 8,5% 75,1% 45,8% ARID3A < SLC25A37 35,1% 41,4% 42,5% CFTR < KLK10 14,1% 51,2% 39,2% CELP < SOX8 34,9% 14,2% 34,7% AMACR < TPK1 11,9% 9,4% 26,6% PTPRO < TM4SF4 14,3% 27,5% 14,2% VAV3 < OSBP2 17,9% 21,5% 11,0% AIFM3 < ZIC2 0,0% 3,7% 10,6% ACOX1 < KIAA0802 1,5% 7,8% 10,2% DDC < AQP5 9,9% 1,1% 10,0% TSPAN6 < RBBP8 1,5% 3,3% 6,6% RNF43 < RBM8A 0,0% 0,0% 5,0% C10orf99 < PLLP 0,0% 1,5% 3,9% SPINK1 < PLK2 0,8% 0,0% 1,7% APCDD1 < FSCN1 1,8% 2,6% 1,3% PHYH < DUSP4 0,0% 0,0% 1,3% PLCB4 < HOXD3 6,8% 0,0% 0,0% CBFA2T2 < PIWIL1 0,0% 0,0% 0,0% SATB2 < RASSF6 0,0% 0,0% 0,0% Tabulka 3: Procento párů genů u jednotlivých typů tkání splňujících pravidlo G1 < G2 16

17 Obrázek 4: Proužkové grafy pro páry genů u normální tkáně, adenomů a karcinomů 3 VÝSLEDKY

3 VÝSLEDKY 3.2 Levá vs. pravá strana střeva BRAF mutace se asi v 60% případů vyskytuje na pravé straně tlustého střeva (Yokota et al., 2011). Do levé strany střeva se počítá konečník, esovitá klička, sestupný tračník a 2/3 příčného tračníku. Zbytek příčného tračníku, vzestupný tračník a slepé střevo se zařazuje na pravou stranu střeva. Na tuto skutečnost jsem se zaměřila ve své bakalářské práci a snažila jsem se porovnávat genové exprese tkání s ohledem na místo odebrání tkáně. V datových souborech GSE20916, GSE9254 a GSM8671 bylo uvedeno, ze kterých částí tlustého střeva daná tkáň pochází a ty jsem využila pro tuto analýzu. Počet pacientů v jednotlivých kategoriích, kteří byli získani z výše zmiňovaných souborů, je uveden v následující tabulce (tab. 4). Strana Normální tkáň Adenom Karcinom Levá 61 66 25 Pravá 14 10 11 Tabulka 4: Počet pacientů v jednotlivých kategoriích Na výsledky jsem pak nahlížela ze dvou úhlů pohledu. Za prvé jsem se zaměřila na sledování rozdílů genové exprese mezi tkáněmi s rozdělením na pravou a levou stranu střeva (obr. 5). Následně jsem se zaměřila na pozorování rozdílů mezi pravou a levou stranou střeva u jednotlivých tkání. V tabulce (tab. 5) je v procentech vyjádřena platnost klasifikačního pravidla pro BRAF mutaci u jednotlivých typů tkáně lokalizovaných na levé straně střeva. 100% platnost u všech tří typů jsem pozorovala u párů: HSF5 < RSBN1L, TNNC2 < CRIP1, ZSWIM1 < MLPH, CDX2 < S100A16 a ZNF141 < C11orf9. Kromě páru TNNC2 < CRIP1 tyto páry platily ve 100% v celém souboru. Naopak páry SATB2 < RASSF6, RNF43 < RBM8A, CBFA2T2 < PIWIL1, PHYH < DUSP4, APCDD1 < FSCN1 a C10orf99 < PLLP nikdy neklasifikovali vzorek jako BRAF mutantní. Páry genů specifické pro normální tkáň na levé straně střeva by mohly být C13orf18 < CTSE a C20orf111 < IK3AP1, u kterých platí tato nerovnost ve více než 85%, což je zároveň dvojnásobný počet případů než u adenomů a karcinomů. U adenomů by se dalo o párech PPP1R14D < REG4 hovořit jako o specifických pro adenom. V případě karcinomů páry PPP1R14C < CD55 a CTTNBP2 < SERPINB5 zachovaly ze 100% klasifikační pravidlo pro BRAF mutaci v tkáni. Dále by specifickými páry pro tuto tkáň mohly být DDC < AQP5 a CFTR < KLK10. 18

3 VÝSLEDKY Pár genů Normální tkáň Adenom Karcinom CTTNBP2 < SERPINB5 67,2% 100,0% 100,0% PPP1R14C < CD55 77,0% 98,5% 100,0% ZNF141 < C11orf9 100,0% 100,0% 100,0% CDX2 < S100A16 100,0% 100,0% 100,0% ZSWIM1 < MLPH 100,0% 100,0% 100,0% TNNC2 < CRIP1 100,0% 100,0% 100,0% HSF5 < RSBN1L 100,0% 100,0% 100,0% CFTR < KLK10 1,6% 37,9% 60,0% PPP1R14D < REG4 27,9% 93,9% 60,0% DDC < AQP5 16,4% 3,0% 60,0% C20orf111 < IK3AP1 85,2% 40,9% 40,0% VAV3 < OSBP2 26,2% 9,1% 24,0% C13orf18 < CTSE 93,4% 45,5% 16,0% AIFM3 < ZIC2 0,0% 0,0% 12,0% ARID3A < SLC25A37 21,3% 21,2% 4,0% PTPRO < TM4SF4 23,0% 19,7% 4,0% AMACR < TPK1 3,3% 0,0% 0,0% C10orf99 < PLLP 0,0% 0,0% 0,0% ACOX1 < KIAA0802 1,6% 0,0% 0,0% APCDD1 < FSCN1 0,0% 0,0% 0,0% PLCB4 < HOXD3 9,8% 0,0% 0,0% PHYH < DUSP4 0,0% 0,0% 0,0% TSPAN6 < RBBP8 1,6% 0,0% 0,0% CBFA2T2 < PIWIL1 0,0% 0,0% 0,0% CELP < SOX8 16,4% 10,6% 0,0% RNF43 < RBM8A 0,0% 0,0% 0,0% SPINK1 < PLK2 1,6% 0,0% 0,0% SATB2 < RASSF6 0,0% 0,0% 0,0% Tabulka 5: Procento párů genů u jednotlivých typů tkání z levé strany střeva splňujících pravidlo G1 < G2 V další tabulce (tab. 6) je opět v procentech vyjádřena platnost klasifikačního pravidla pro BRAF mutaci u jednotlivých typů tkáně, ale tentokrát lokalizovaných na pravé straně střeva. 100% platnost u všech tří typů jsem pozorovala znovu u párů: HSF5 < RSBN1L, TNNC2 < CRIP1, ZSWIM1 < MLPH, CDX2 < S100A16 a ZNF141 < C11orf9. Naopak páry SATB2 < RASSF6, RNF43 < RBM8A, CBFA2T2 < PIWIL1, PHYH < DUSP4, APCDD1 < FSCN1 a C10orf99 < PLLP nikdy neklasifikovaly vzorek jako BRAF mutantní. Na rozdíl od tkání z levé strany střeva, u páru SPINK1 < PLK2 jem v ani jednom případě nepozorovala platnost pravidla specifického pro BRAF mutaci. Při sledování rozdílů mezi třemi typy tkáně stojí za zmínku více než 21%platnost klasifikačního pravidla pro BRAF mutaci u páru PLCB4 < HOXD3 pro normální tkáň zatímco u adenomů a karcinomů nebyl ani jeden výskyt. Obdobně pár AIFM3 < ZIC2 pro karcinom klasifikoval 18,2%vzorků jako BRAF mutantních, kdežto v případě adenomu a normální tkáně jsem klasifikovala 0% Zjišt ováním genů, které by mohly být specifické pro jednotlivé tkáně odebrané na pravé straně střeva, jsou výsledky v případě adenomů totožné s levou stranou střeva. Pro normální 19

3 VÝSLEDKY tkáň by specifickým párem genů mohl být pár C20orf111 < IK3AP1, který splňoval pravidlo G1 < G2 pro BRAF mutaci ve všech vzorcích. A pro karcinom z pravé strany střeva považuji za specifické páry PPP1R14C < CD55 a CTTNBP2 < SERPINB5. Pár genů Normální tkáň Adenom Karcinom CTTNBP2 < SERPINB5 64,3% 100,0% 90,9% PPP1R14C < CD55 57,1% 100,0% 100,0% ZNF141 < C11orf9 100,0% 100,0% 100,0% CDX2 < S100A16 100,0% 100,0% 100,0% ZSWIM1 < MLPH 100,0% 100,0% 100,0% TNNC2 < CRIP1 100,0% 100,0% 100,0% HSF5 < RSBN1L 100,0% 100,0% 100,0% CFTR < KLK10 28,6% 50,0% 54,5% PPP1R14D < REG4 7,1 % 100,0% 72,7% DDC < AQP5 28,6% 10,0% 27,3% C20orf111 < IK3AP1 100,0% 40,0% 36,4% VAV3 < OSBP2 0,0% 10,0% 27,3% C13orf18 < CTSE 71,4% 70,0% 27,3% AIFM3 < ZIC2 0,0% 0,0% 18,2% ARID3A < SLC25A37 28,6% 20,0% 18,2% PTPRO < TM4SF4 35,7% 30,0% 18,2% AMACR < TPK1 21,4% 0,0% 0,0% C10orf99 < PLLP 0,0% 0,0% 9,1% ACOX1 < KIAA0802 7,1% 0,0% 0,0% APCDD1 < FSCN1 0,0% 0,0% 0,0% PLCB4 < HOXD3 21,4% 0,0% 0,0% PHYH < DUSP4 0,0% 0,0% 0,0% TSPAN6 < RBBP8 7,1% 0,0% 9,1% CBFA2T2 < PIWIL1 0,0% 0,0% 0,0% CELP < SOX8 28,6% 10,0% 18,2% RNF43 < RBM8A 0,0% 0,0% 0,0% SPINK1 < PLK2 0,0% 0,0% 0,0% SATB2 < RASSF6 0,0% 0,0% 9,1% Tabulka 6: Procento párů genů u jednotlivých typů tkání z pravé strany střeva splňujících pravidlo G1 < G2 20

21 Obrázek 5: Proužkové grafy pro páry genů u normální tkáně, adenomů a karcinomů 3 VÝSLEDKY

3 VÝSLEDKY U normální tkáně jsem pozorovala ze 100% zachování vztahů pro BRAF mutaci u párů ZNF141 < C11orf9, CDX2 < S100A16, ZSWM1 < MLPH, TNNC2 < CRIP1 a HSF5 < RSDN1L, a to bez závislosti na straně výskytu ve střevě. Zajímavostí je, že vztah VAV3 < OSBP2 byl v normální tkáni na levé straně střeva zachovaný ve více jak 1/4 případů, zatímco na straně pravé nebyl zachován ani v jednom případě. V následující tabulce (tab. 7) jsem zaznamenala v kolikati procentech případů platí vztah genů G1 < G2, který je specifický pro BRAF mutantní nádory, v normální tkáni s ohledem na místo odebrání. Pro zjišt ování, zda je rozdíl mezi pravou a levou stranou statisticky významný jsem použila Pearsonův chí-kvadrát test na hladině významnosti α=0.05. Na základě p-hodnoty jsem určila páry genů VAV3 < OSBP2 a PPP1R14D < REG4 jako specifické pro levou stranu střeva a páry CFTR < KLK10 a AMACR < TPK1 jako specifické pro pravou stranu střeva. Výsledky by mohly znamenat, že BRAF mutanti mají rozdílně exprimované geny na levé a pravé straně střeva. Pár genů Levá strana Pravá strana p-hodnota VAV3 < OSBP2 26,2% 0,0% 0,0000086184 CFTR < KLK10 1,6% 28,6% 0,0000125468 AMACR < TPK1 3,3% 21,4% 0,0025256000 PPP1R14D < REG4 27,9% 7,1% 0,0030688000 PLCB4 < HOXD3 9,8% 21,4% 0,2118480000 TSPAN6 < RBBP8 1,6% 7,1% 0,2145422222 ACOX1 < KIAA0802 1,6% 7,1% 0,2145422222 DDC < AQP5 16,4% 28,6% 0,2145422222 CELP < SOX8 16,4% 28,6% 0,2145422222 PPP1R14C < CD55 77,0% 57,1% 0,2203854545 C13orf18 < CTSE 93,4% 71,4% 0,2203854545 PTPRO < TM4SF4 23,0% 35,7% 0,2271733333 SPINK1 < PLK2 1,6% 0,0% 0,4434769231 C20orf111 < IK3AP1 85,2% 100,0% 0,5536000000 ARID3A < SLC25A37 21,3% 28,6% 0,5626133333 CTTNBP2 < SERPINB5 67,2% 64,3% 1,00 SATB2 < RASSF6 0,0% 0,0% 1,00 RNF43 < RBM8A 0,0% 0,0% 1,00 CBFA2T2 < PIWIL1 0,0% 0,0% 1,00 PHYH < DUSP4 0,0% 0,0% 1,00 APCDD1 < FSCN1 0,0% 0,0% 1,00 C10orf99 < PLLP 0,0% 0,0% 1,00 AIFM3 < ZIC2 0,0% 0,0% 1,00 HSF5 < RSBN1L 100,0% 100,0% 1,00 TNNC2 < CRIP1 100,0% 100,0% 1,00 ZSWIM1 < MLPH 100,0% 100,0% 1,00 CDX2 < S100A16 100,0% 100,0% 1,00 ZNF141 < C11orf9 100,0% 100,0% 1,00 Tabulka 7: Procento párů genů u normální tkáně splňujících pravidlo G1 < G2 s ohledem na místo výskytu (řazeno dle p-hodnoty). 22

3 VÝSLEDKY V případě adenomů jsem nepozorovala významné rozdíly v zachování klasifikačního pravidla pro BRAF mutace mezi pravou a levou stranou střeva (tab. 8). Po použití Pearsonova chí-kvadrát testu a následné Benjamini-Hochberg korekce p-hodnot jsem zjistila, že ani jeden pár nevyšel statisticky významný pro levou nebo pravou stranu střeva. Pár genů Levá strana Pravá strana p-hodnota C13orf18 < CTSE 45,5% 70,0% 0,63364 DDC < AQP5 3,0% 10,0% 0,73080 PTPRO < TM4SF4 19,7% 30,0% 1,00 CFTR < KLK10 37,9% 50,0% 1,00 PPP1R14D < REG4 93,9% 100,0% 1,00 VAV3 < OSBP2 9,1% 10,0% 1,00 ARID3A < SLC25A37 21,2% 20,0% 1,00 CELP < SOX8 10,6% 10,0% 1,00 PPP1R14C < CD55 98,5% 100,0% 1,00 C20orf111 < IK3AP1 40,9% 40,0% 1,00 SATB2 < RASSF6 0,0% 0,0% 1,00 SPINK1 < PLK2 0,0% 0,0% 1,00 RNF43 < RBM8A 0,0% 0,0% 1,00 CBFA2T2 < PIWIL1 0,0% 0,0% 1,00 TSPAN6 < RBBP8 0,0% 0,0% 1,00 PHYH < DUSP4 0,0% 0,0% 1,00 PLCB4 < HOXD3 0,0% 0,0% 1,00 APCDD1 < FSCN1 0,0% 0,0% 1,00 ACOX1 < KIAA0802 0,0% 0,0% 1,00 C10orf99 < PLLP 0,0% 0,0% 1,00 AMACR < TPK1 0,0% 0,0% 1,00 AIFM3 < ZIC2 0,0% 0,0% 1,00 HSF5 < RSBN1L 100,0% 100,0% 1,00 TNNC2 < CRIP1 100,0% 100,0% 1,00 ZSWIM1 < MLPH 100,0% 100,0% 1,00 CDX2 < S100A16 100,0% 100,0% 1,00 ZNF141 < C11orf9 100,0% 100,0% 1,00 CTTNBP2 < SERPINB5 100,0% 100,0% 1,00 Tabulka 8: Procento párů genů u adenomů splňujících pravidlo G1 < G2 s ohledem na místo výskytu (řazeno dle p-hodnoty). 23

3 VÝSLEDKY U karcinomů jsem pozorovala (tab. 9) 100% zachování vztahu G1 < G2 u šesti párů: PPP1R14C < CD55, ZNF141 < C11orf9, CDX2 < S100A16, ZSWM1 < MLPH, TNNC2 < CRIP1 a HSF5 < RSDN1L. Dále jsem pozorovala, že zatímco páry C10orf99 < PLLP, TSPAN6 < RBBP8, CELP < SOX8 a SATB2 < RASSF6 s výskytem v karcinomech na levé straně nikdy neklasifikovaly BRAF mutaci, tak na pravé straně došlo k zachování vztahu pro klasifikaci do 20%. Na základě Pearsonova chí-kvadrát testu na hladině významnosti 0.05 byl tento rozdíl určen jako statisticky významný a tyto páry považuji za specifické pro kracinom vyskytující se na pravé straně střeva. Také páry PTPRO < TM4SF4 a ARID3A < SLC25A37 jsem určila jako pravděpodobně specifické pro pravou stranu střeva, protože p-hodnota v chí-kvadrát testu vyšla menší než mnou zvolená hladina významnosti. Rozdíl u páru DDC < AQP5 mezi levou a pravou stranou je 32,7% a na základě Pearsnova chí-kvadrát testu byl tento rozdíl určen jako významný a tento pár je specifický pro výskyt karcinomu na levé straně střeva. Pár genů Levá strana Pravá strana p-hodnota CELP < SOX8 0,0% 18,2% 0,00055692 DDC < AQP5 60,0% 27,3% 0,0065184 SATB2 < RASSF6 0,0% 9,1% 0,01032 TSPAN6 < RBBP8 0,0% 9,1% 0,01032 C10orf99 < PLLP 0,0% 9,1% 0,01032 PTPRO < TM4SF4 4,0% 18,2% 0,01032 ARID3A < SLC25A37 4,0% 18,2% 0,01032 C13orf18 < CTSE 16,0% 27,3% 0,300755 AIFM3 < ZIC2 12,0% 18,2% 0,75684 PPP1R14D < REG4 60,0% 72,7% 0,75684 CTTNBP2 < SERPINB5 100,0% 90,9% 1,00 CFTR < KLK10 60,0% 54,5% 1,00 VAV3 < OSBP2 24,0% 27,3% 1,00 C20orf111 < IK3AP1 40,0% 36,4% 1,00 SPINK1 < PLK2 0,0% 0,0% 1,00 RNF43 < RBM8A 0,0% 0,0% 1,00 CBFA2T2 < PIWIL1 0,0% 0,0% 1,00 PHYH < DUSP4 0,0% 0,0% 1,00 PLCB4 < HOXD3 0,0% 0,0% 1,00 APCDD1 < FSCN1 0,0% 0,0% 1,00 ACOX1 < KIAA0802 0,0% 0,0% 1,00 AMACR < TPK1 0,0% 0,0% 1,00 HSF5 < RSBN1L 100,0% 100,0% 1,00 TNNC2 < CRIP1 100,0% 100,0% 1,00 ZSWIM1 < MLPH 100,0% 100,0% 1,00 CDX2 < S100A16 100,0% 100,0% 1,00 ZNF141 < C11orf9 100,0% 100,0% 1,00 PPP1R14C < CD55 100,0% 100,0% 1,00 Tabulka 9: Procento párů genů u karcinomů splňujících pravidlo G1 < G2 s ohledem na místo výskytu (řazeno dle p-hodnoty). 24

3 VÝSLEDKY 3.3 Pilovitý adenom vs. nepilovité adenomy a karcinomy Pilovité polypy, histologické varianty hyperplastických polypů, velmi často představují riziko maligního zvratu a uvažuje se o nich jako o nádorech s jinou cestou vzniku, které v 75-83% mají BRAF mutaci (Leggett et al., 2010). K pozorování rozdílů odlišně exprimovaných genů u pilovitých adenomů a nepilovitých adenomů jsem měla k dispozici pouze jeden soubor GSE12514, který obsahoval jen 8 pacientů a pouze 10 kompletních párů genů ke klasifikaci. U 3 pacientů byly pozorovány polypy a u 5 pacientů histologické varianty hyperplastických polypů - pilovité polypy. V případě pilovitých polypů byly na základě mtsp 4 vzorky (80%) predikovány jako BRAF mutantní. U vzorků s nepilovitou variantou polypů jsem predikovala pouze jeden (33,3%) jako BRAF mutantní. Použitím Fisherova exaktního testu jsem zjistila, že tento rozdíl není významný, ale tento výsledek může být velmi ovlivněn faktem, že jsem měla k dispozici pouze 8 pacientů. Specifické páry genů v případě pilovité varianty polypu by mohly být AMACR < TPK1 a APCDD1 < FSCN1. Z grafu (obr. 6) vidíme, že pravidlo G1 < G2 bylo zachováno z 80 a více procent. Při detailním prozkoumání jsem zjistila, že pro tyto dva páry vztah platí právě u 4 vzorků, které na základě mtsp splňovaly klasifikační pravidlo pro BRAF mutaci v nádoru. Pro oba páry také platil vztah genů G1 < G2 u pacienta s nepilovitým adenomem, kterého jsem při použití mtsp klasifikovala jako pacienta s BRAF mutací. U tohoto pacienta jako jediného s nepilovitým adenomem jsem také pozorovala zachování vztahů G1 < G2 u páru CTTNBP2 < SERPINB5. Dále stojí za zmínku páry CBFA2T2 < PIWIL1 a RNF43 < RBM8A (p-hodnota u obou < 0,01), které v případě nepilovitého adenomu predikují BRAF mutaci v 0% zatímco u pilovitého adenomu jsem detekovala výskyt BRAF mutace u 40% vzorků. Další statisticky významný rozdíl byl u párů TSPAN6 < RBBP8 a PHYH < DUSP4, u kterých p-hodnota po Benjamini-Hochbergově korekci vyšla < 0,01 a proto by tento pár mohl být specifický pro nepilovité adenomy. Obrázek 6: Proužkový graf pro páry genů u pilovitých a nepilovitých polypů Ke sledování odlišně exprimovaných genů u pilovitých a nepilovitých karcinomů jsem měla k dispozici jen jeden soubor GSE4045, který obsahoval 37 pacientů a 16 kompletních 25

3 VÝSLEDKY párů genů ke klasifikaci. U 29 pacientů byly pozorované karcinomy a 8 pacientů byly pozorovány histologické varianty karcinomů - pilovité karcinomy. V případě pilovitých polypů byly na základě mtsp 6 vzorků (75%) predikovány jako BRAF mutantní. U vzorků s nepilovitou variantou polypů jsem predikovala 4 vzorky (13,8%) jako BRAF mutantní. Toto procento odpovídá procentuálnímu zastoupení BRAF-like nádorům, o kterých jsem se zmiňovala již dříve. I na tyto výsledky jsem použila Fisherův exaktní test a zjistila jsem, že tento rozdíl je statisticky významný. Za specifické páry genů pro pilovité karcinomy jsem určila TSPAN6 < RBBP8 a CFTR < KLK10, které se vyskytly u všech pacientů, kteří na základě mtsp byli klasifikovaní jako BRAF mutantní. U pacientů s pilovitým karcinomem, ale neklasifikovaných jako BRAF mutantní, tyto páry genů nesplňovaly pravidlo G1 < G2. Avšak u nepilovitých karcinomů jsem žádné podobné znaky nepozorovala. Na garfu (obr. 7) je zobrazeno v kolika procentech případů bylo zachované pravidlo G1 < G2, které je specifické pro BRAF mutantní nádory, u jednotlivých párů genů. U párů PHYH < DUSP4, PLCB4 < HOXD3, PTPRO < TM4SF4 a RNF43 < RBM8A jsem pomocí Pearsonova chí-kvadrtá testu zjistila statisticky významný rozdíl mezi pilovitým a nepilovitým karcinomem, p-hodnota po Benjamini-Hochbergově korekci vyšla mnohem menší než 0,01. Obrázek 7: Proužkový graf pro páry genů u pilovitých a nepilovitých polypů V tabulce 10 je přehled v kolika procentech platí vztah G1 < G2 u pilovitých adenomů a karcinomů a u nepilovitých adenomů a karcinomů. Porovnání mezi populací s karcinomem a adenomem bylo možné udělat jen u šesti párů. Hned první velký rozdíl jsem pozorovala u páru DDC < AQP5, který se v pilovitých adenomech vyskytoval v 60%, zatímco v pilovitých karcinomech ani jednou. Stejné to bylo i v případě nepilovitých adenomů a karcinomů. Další významný rozdíl byl pozorován u párů CFTR < KLK10 a RNF43 < RBM8A. U těchto párů platil vztah, který je typický pro BRAF mutantní nádory, u karcinomů v 75% a u adenomů ve 40% a 60%. Poslední rozdíl pozorovaný mezi pilovitými adenomy a karcinomy je vztah u páru PHYH < DUSP4, který se v adenomech vůbec nevyskytoval a v karcinomech se vyskytl ve 25%. Naopak u nepilovitých adenomů a karcinomů byl vztah páru PHYH < DUSP4 zachován u adenomů a u karcinomů nebyl zachován v ani jednom případě. 26