Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/07.0354
Genomika (KBB/GENOM)
Analýza transkriptomu Ing. Hana Šimková, CSc.
Cíl přednášky - seznámení s moderními metodami komplexní analýzy transkriptomu Klíčová slova - Transkriptom, cdna microarraye, oligonukleotidové arraye, profilování exprese pomocí kuliček, SAGE, masivně paralelní sekvenování
ANALÝZA GENOVÉ EXPRESE Transkriptom úplný soubor transkriptů v jejich reálném relativním zastoupení v určitém typu buněk nebo tkáně za definovaných podmínek Transkriptomika srovnávací studie transkriptů Metody pro studium transkripce: A) metody stanovující transkripční aktivitu spojenou s daným genem B) metody analyzující množství určitého transkriptu Metody studující hladiny exprese všech genů v organismu A) Paralelní analýza genové exprese cdna microarraye oligonukleotidové arraye exprese B) Sériová analýza genové exprese SAGE - ke stanovení absolutních hladin transkripce - pro porovnání hladin exprese mezi tkáněmi a za určitých podmínek - nedávají informace o konkrétní hladině
MICROARRAYE (MA) Využití: - k nalezení genů diferenciálně exprimovaných za různých podmínek k nalezení kandidátních genů (např. souvisejících s chorobami) k anotaci funkce genu k definování genetických drah ke kvantifikaci transkripční variability např. v evolučních studiích Důležité navržení designu experimentu: - formulace biologické otázky - navržení platformy - konzultace se statistikem kolik opakování je potřeba (rozumné 6-10 hybridizací) Opakování a) jednotlivých kroků, spotů b) použitých biologických vzorků (např. různých jedinců)
Princip: cdna microarray - na mikroskopické sklíčko se kovalentně navážou malá množství DNA, reprezentující tisíce genů (= sondy, probes) a ta jsou hybridizována s cílovými molekulami (= target) cdna, mrna, které byly označeny fluorescenčními barvičkami. Intenzita fluorescenčního signálu (odpovídá četnosti transkriptu ve vzorku) se měří a) ve vztahu ke kontrolnímu referenčnímu vzorku (např. zdravý jedinec) poměr (ratio) intenzity fluorescence červené (Cy5) a zelené barvičky (Cy3) - spolehlivější b) ve vztahu k signálům z jiných sond relativní intenzita referenční vzorek studovaný vzorek mrna cdna Gibson a Muse, 2004
cdna microarraye Fragmenty cdna amplifikované pomocí PCR (ESTy) jsou naneseny s vysokou hustotou (10-50 teček/mm 2 ) na mikroskopické sklíčko nebo nylonovou membránu a hybridizovány s radioaktivně nebo fluorescenčně značenou cílovou molekulou (cdna, RNA). Místo ESTů mohou být produkty PCR na genomické DNA s primery specifickými pro jednotlivé geny. Ideálně každý nanesený EST by měl reprezentovat 1 gen nebo 1 variantu sestřihu. Taková sbírka ESTů se nazývá unigene set. Jednotlivé kroky: 1. Amplifikace souboru ESTů nejdražší 2. Nanesení na sklíčko nebo membránu - po cca 10 ng - speciálně upravený povrch DNA se na něj kovalentně váže Gibson a Muse, 2004
Microarraye dlouhých oligonukleotidů (50-70 bází) - vyráběny na zakázku - neprovádí se PCR amplifikace Princip: - na sklíčko nanášen 1 řetězec DNA o stejné délce a obdobném zastoupení jednotlivých bází umožňuje jednotné podmínky hybridizace. Lepší kontrola jednotlivých vzorků. K navrhování oligonukleotidů např. program OligoArray eliminuje křížovou hybridizaci. Nanášení vzorků: a) jako u cdna b) syntéza oligonukleotidů přímo na sklíčku Agilent Technologies až 44 000 oligonukleotidů na sklíčku
- Affymetrix Gene Chip Genové čipy s krátkými oligonukleotidy Princip: Sondy série 25-bázových oligonukleotidů navržených počítačem tak, aby reprezentovaly všechny dostupné ORF. Každý gen reprezentován 10-20 různými oligonukleotidy. Hybridizace za velmi přísných podmínek. Pro kontrolu vedle vlastní sondy nanesena sonda s 1 zaměněnou bází (= mismatch reference) vlastní intenzita signálu se vypočítá na základě rozdílu intenzity pro perfect match a mismatch. Vypočítá se průměr pro všechna oliga příslušející 1 genu. Gibson a Muse, 2004
Genové čipy s krátkými oligonukleotidy Konstrukce: - na silikonovém čipu a za použití kombinatoriální chemie (cyklické přidávání A, T, G, C, na syntézu 25-merů 100 reakcí) Srovnání oligoarrayí s cdna arrayemi: Gibson a Muse, 2004 větší hustota genů, i pro geny, které nejsou v cdna knihovně, menší variabilita mezi čipy, obsahuje kontroly pro mismatch, možnost porovnávat výsledky mezi laboratořemi, komerčně dostupné nejsou dostupné pro všechny organismy, drahé, nemůžeme si je upravit dle svých potřeb. Můžou vést snadněji ke křížovým hybridizacím, více ovlivněny polymorfismem.
Značení a hybridizace cílových molekul mrna A) Přímé značení: cdna připravená z mrna reverzní transkripcí obvykle z polyt primeru. Nejčastěji se inkorporují barvičky Cy3 a Cy5 navázané na nukleotidu. Případně nukleotidy s aminoallylovou skupinou, na kterou se po reakci naváže barvička účinnější. Nevýhoda vyžaduje velké množství mrna. cdna sonda na sklíčku B) Značení přes amplifikovanou RNA cdna připravena z mrna za pomoci primeru skládajícího se z polyt+ T7 promotoru - z něho syntéza arna in vitro transkripcí (T7 RNA polymerázou). Zabudovávají se nukleotidy, které mají připojenu aminoallylovou skupinu nebo biotin. Na ten se po hybridizaci naváže streptavidin nesoucí barvičku. Stačí 100 ng RNA. arna Gibson a Muse, 2004
C) Nepřímé značení - primer pro syntézu cdna (polyt) má připojený tzv. substrát (3DNA). Ten je po hybridizaci rozeznán protilátkou s navázanými fluorofory (barvičkami). D) Radioaktivní značení - pro microarraye na membránách. Sonda se dá odmýt 1 membrána se dá použít až 6x. Levnější. Hybridizace a odmývání za přísných podmínek cdna Gibson a Muse, 2004
Detekce Vizualizace hybridizované cílové sekvence (target) na MA: - snímání fluorescence indukované laserem - konfokální laserový skenr - CCD kamera Gibson a Muse, 2004 Následuje počítačové vyhodnocení získaných fluorescenčních signálů.
Analýza dat Gibson a Muse, 2004 Intenzity fluorescence odečtené z arrayí jsou převedeny do červenozelené škály (nesouvisí s barvičkami použitými pro značení cílových molekul) - červená = vyšší hladina exprese než referenční vzorek - zelená = nižší hladina exprese než referenční vzorek - černá = stejná úroveň exprese jako referenční vzorek Hierarchické klastrování genové exprese = vytváření skupin genů s podobným průběhem exprese. Geny s neznámou funkcí (UNK) se dostanou do skupin s geny se známou funkcí formulace hypotéz o možné funkci neznámých genů.
Využití oligonukleotidových microarrayí pro genetické mapování - genomický nástroj pro mapování (vysoko-kapacitní metoda) - nový typ molekulárního markeru: single feature polymorphism (SFP, polymorfismus v jednom znaku) - hybridizací genomické DNA s oligonukleotidovými arrayemi na základě rozdílu v intenzitě signálu detekovány sekvenční polymorfismy (porovnáním signálu pro perfect match a mismatch) zejména SNP a inzerce/delece - použity pro genotyping a sestavení genetických map Arabidopsis Affymetrix expresní array 103 860 perfect match (PM) oligonukleotidů dávajících jeden signál (PM features) 4 000 SFP markerů v rámci jedné mapovací populace
Profilování exprese s použitím mikrokuliček - místo sklíček použity 3 µm kuličky Systém BADGE na různobarevných kuličkách ( unikátní barevný kód) navázány oligonukleotidové sondy. Po hybridizaci s fluorescenčně značenými cílovými cdna se provede analýza pomocí dvoulaserového průtokového cytometru. Vyhodnocuje se jednak barevný kód, jednak intenzita fluorescence navázané cdna. Mikrokuličky mohou být navázány také na optických vláknech systém Illumina Bead Array. Gibson a Muse, 2004
SAGE (serial analysis of gene expression) - metoda pro určení absolutní četnosti každého transkriptu exprimovaného v populaci buněk. NlaIII -bio -bio -bio -bio Pro každý gen se odvodí unikátní 15-bp sekvenční visačka (tag). Visačky pro řadu genů se napojí za sebe (konkatenace) a sekvenují se naráz. V 1 sekvenační reakci až 50 visaček. Pro každý vzorek je potřeba minimálně 50 000 tagů, abychom dosáhli saturace saturovaná kolekce každý exprimovaný gen je v kolekci zastoupen min. 2x. Hodně drahé (saturovaná kolekce min. 2000 $) vhodné jen pro menší počet opakování. Spolehlivé, nejsou hybridizační artefakty, možno porovnávat mezi laboratořemi. Dnes se používá hlavně v kombinaci se sekvenačními technologiemi nové generace bez konkatenace. Gibson a Muse, 2004 -bio bio- -bio bio-
Analýza transkriptomu pomocí masivně paralelního sekvenování Vhodné zejména systémy Illumina a Solid -levnější -krátká čtení tolik nevadí, pokud existuje předloha pro sestavení - zvláště vhodné pro sekvenování smrna (velikost 20-30 nukleotidů) - poskytují informaci i o hladině exprese (četnosti transkriptů) 454 ke skládání transkribovaných sekvencí de novo větší dynamický rozsah - více než 5 řádů (MA 2-3 řády), lepší schopnost rozlišit alelickou expresi. Ve srovnání s konvenčním sekvenováním mnohem větší objem dat, levnější, dovoluje detekovat i poměrně vzácné transkripty. ve srovnání s MA dosud vyšší cena, některé postupy nejsou ještě zcela optimalizované. Shoda výsledků z arrayí a sekvenování jen asi 30% - zatím nutno obě metody kombinovat.