Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/07.0354
Genomika (KBB/GENOM)
SNPs Odvozování a genotyping Ing. Hana Šimková, CSc.
Cíl přednášky - seznámení s problematikou hledání SNP, odvozování SNP markerů a charakterizací genotypu (genotyping) Klíčová slova - SNP markery, SNP genotyping, resekvenování, sekvenování pomocí hybridizace, heteroduplexy, minisekvenační metody, metody založené na fluorogenních systémech, Illumina GoldenGate Assay
SNP A GENOTYPING Objevování SNP A) resekvenováním - SNP se nacházejí na základě porovnávání sekvencí získaných z různých jedinců, genotypů, linií 1. Identifikace SNP srovnáním celogenomové sekvence s cdna sekvencemi v GenBank srovnáním ESTů v databázích s využitím statistických programů (např. PolyBayes odhaluje nepravé SNP) srovnáním genomových sekvencí z různých jedinců 2. Ověření SNP resekvenováním úseku DNA kolem SNP z 10-100 jedinců metodami používanými pro genotyping
Resekvenování cílových oblastí NimbleGen Sequence capture - zachycení cílových sekvencí ze vzorků fragmentované genomické DNA hybridizací na mikročip - na mikročipu naneseny sondy pro cílové oblasti - např. exony nebo oblasti vykazující asociaci s chorobami - odmytí nenavázaných fragmentů - vymytí a amplifikace zachycených fragmentů - osekvenování pomocí technologie 454 Mikročipy vyráběny na zakázku - sestava sekvencí dle přání zákazníka - až 5 Mb sekvencí
B) nalezením polymorfismů bez sekvenování a) metody vycházející ze specifických vlastností heteroduplexní DNA (= dvouřetězcová DNA, kde každý řetězec nese jinou alelu, vytváříme ji in vitro) je méně stabilní než homoduplex, dříve denaturuje - vzniká po PCR amplifikaci studovaného lokusu, následované denaturací a renaturací tvorba homoduplexů a heteroduplexů DHPLC (denaturující HPLC) produkty PCR po renaturaci se nanesou na chromatografickou kolonu, eluce fragmentů za pomoci organického rozpouštědla. Heteroduplexy jsou pomalejší. DGGE (denaturující gradientová gelová elektroforéza) na polyakrylamidovém gelu s denaturačním gradientem (močovina). Heteroduplexy denaturují dříve zpomalí se. TILLING (cíleně indukovaná lokální léze v genomech)
TILLING (targeting induced local lesions in genomes) - k detekci SNP (EcoTILLING) a indukovaných mutací (TILLING) Založena na schopnosti nukleáz specifických pro jednořetězce štěpit heteroduplexy. Hledání polymorfismu (SNP) mezi jedinci s normálním (N) a mutantním (M) fenotypem: - z obou se naizoluje DNA, pomocí PCR se naamplifikuje určitý úsek (gen), smíchá se, zdenaturuje. Při renaturaci se tvoří jednak homoduplexy (pro N i M genotyp), jednak heteroduplexy. Ty jsou v místě nesouladu (mismatch) roštěpeny nukleázou na sekvenátoru u heteroduplexu místo 1 fragmentu 2. Pro hlavní modelové organismy se připravují kolekce primerů pro všechny lokusy v genomu umožní proskrínovat polymorfismy v celém genomu. EcoTILLING nebo nebo Denaturace, zchlazení Normální Mutant Heteroduplex Analýza na PA gelu nebo sekvenátoru Gibson a Muse, 2004
b) metoda založená na detekci heterozygotů SSCP (single-stranded conformation polymorphism) analýza = polymorfismus konformace jednořetězců DNA zdenaturována a nanesena na nedenaturační polyakrylamidový gel. Elektroforéza při 4 C DNA nerenaturuje, ale tvoří intramolekulární sekundární struktury. Každé vlákno jiná sekundární struktura (konformace). Řetězec W AA aa Aa Denaturace formamidem a teplem Řetězec C Homozygot 2 konformace 2 proužky na elektroforéze Heterozygot 4 konformace 4 proužky na elektroforéze Nižší kapacita, fragmenty jen do 400 bp Gibson a Muse, 2004
SNP genotyping - charakterizace genotypů pomocí SNP A) Low-tech metody ASO (alelově specifická oligohybridizace) - cílová sekvence amplifikována z jednotlivců v 96-jamkových miskách přenos na membránu, hybridizace s krátkými oligonukleotidy (15-bp) za velmi přísných podmínek signál jen při 100% komplementaritě PCR-RFLP - amplifikace specifického fragmentu pomocí PCR + štěpení produktu restriktázou (zachytí SNP v rekogničním místě) = CAPS Gibson a Muse, 2004
dcaps (vytvořené štěpitelné amplifikované polymorfní sekvence) Amplifikace + štěpení. PCR primer navržen tak, že pro jednu z alel (A) se za použití speciálního primeru vytvoří rekogniční místo pro restriktázu po štěpení restriktázou vzniká pro alelu A fragment o něco kratší Alela T Dlouhý produkt Alela A Štěpený produkt Gibson a Muse, 2004
B) Minisekvenační metody - sekvenuje se pouze 1 nebo několik nukleotidů SBE (prodloužení jedné báze) - prodloužení 3 konce primeru o jediný nukleotid ddntp (ukončí reakci) je fluorescenčně značený. Primer se váže svým 3 koncem 1 bázi před SNP místo. Multiplexing - jako templát slouží produkty multiplexní PCR (naamplifikované fragmenty DNA pro několik různých SNP). Reakce může probíhat - na čipu (primery fixovány) - v roztoku k rozlišení jednotlivých SNP: a) primery různých délek b) vychytání produktů SBE na mikrokuličky na základě zip kódu pro jednotlivé primery SBE na čipu Gibson a Muse, 2004 (amplifikace analyzovaných lokusů) Izolace cílové ssdna zachycením na kuličky se streptavidinem SBE v roztoku
ad b) vychytání produktů SBE na mikrokuličky -kuličky separovány průtokovým cytometrem na základě barevného kódu (viz přednáška Analýza exprese) -kuličky fixovány na arrayi (viz Illumina genotyping) c) K separaci jednotlivých produktů SBE lze místo fluorescence použít hmotnostní spektrometrie MALDI-TOF do reakce přidán jen jeden typ ddntp (+ ostatní dntps) pokud odpovídá variantě v SNP, reakce se ukončí hned, jinak až po několika nukleotidech. MALDI-TOF rozliší oba typy produktů podle velikosti, případně náboje. Lze provádět paralelně analýzu 384 vzorků.
Pyrosekvenování -může se provádět v 96-jamkových mističkách. Detekce v reálném čase. Může určit také frekvenci výskytu alely ve studované populaci semikvantitativní metoda. A A A Gibson a Muse, 2004
C) Homogenní metody založené na fluorogenních barvičkách Homogenní testy v 1 reakci v roztoku (spojení amplifikace s genotypingem). Založeny na a) ASO a použití 2 fluorescenčních barviček s překrývajícími se spektry reportér (R) a zhášeč (Q) detekovány v průběhu PCR (v misce, kapiláře). Pokud jsou v těsné blízkosti (např. 2 konce krátkého oligonukleotidu), není detekována fluorescence reportéru TaqMan 5 exonukleázový test využívá exonukleázové aktivity Taq polymerázy (při extenzi nového řetězce postupně odbourává sondu fluorescence) Molekulární majáky (Molecular beacons - MB) - majáky jsou alelově specifické oligonukleotidy obklopené krátkými inverzními repeticemi vzniká vlásenka se smyčkou R a Q blízko sebe nevzniká fluorescence. Po 100% hybridizaci na templát se R a Q dostanou od sebe vzniká fluorescence (může být alelově specifická) Do reakce sondy pro obě alely SNP (s 2 různými barvičkami) + primery pro amplifikaci lokusu SNP Gibson a Muse, 2004
b) alelově specifické ligaci a přenosu energie fluorescenční rezonancí (FRET) DOL (dye-labeled oligonucleotide ligation assay). Donor v dostatečné blízkosti stimuluje fluorescenci reportéru. SNP Gibson a Muse, 2004 Do reakce - polymeráza - primery + 3 oliga (2 různě značené sondy pro 2 alely SNP) - termostabilní ligáza PCR nejprve při vyšší, pak nižší T a (k nasednutí sond)
c) rozdílech v teplotě tání amplikonů HRM analýza (high-resolution melting analysis) Vybraný lokus je amplifikován, vzniklá dsdna se nabarví fluorescenční barvičkou interkalátor fluorescence jen dokud je DNA dvouřetězcová Real-time PCR fluorescence je měřena křivka teploty tání (high-resolution melting curve) Pomalá denaturace amplikonu Rozdíl jediného nukleotidu mění tvar křivky Lze rozlišit heterozygota od obou typů homozygotů http://en.wikipedia.org/wiki/high_resolution_melt
Illumina vysokokapacitní metoda k určení genotypu na velkém souboru SNP (v krátkém čase a za rozumnou cenu).
Co to vlastně Illumina je? http://www.illumina.com Je to systém kombinující několik komponentů: - miniaturizovanou array jednotlivých arrayí (Sentrix Array Matrix) - konfokální skenr s vysokým rozlišením (BeadArray Reader) - vysoce multiplexní analýza genotypu (GoldenGate Assay)
Jak vypadá Sentrix Array Matrix? Tvoří ji : 96 miniaturních arrayí (každá o průměru 1,2 mm) uspořádaných do matrice 8x12. každá array je tvořena cca 50 000 optickými vlákny spojenými do svazku každé má na konci jamku a v ní kuličku o průměru 3 µm na každé kuličce je kovalentně navázáno několik stejných oligonukleotidů (=illumicode=adresa) illumicode #561 /\/\/\/ illumicode #217 /\/\/\/ illumicode #1024 /\/\/\/ http://www.illumina.com
Jednomu analyzovanému SNP lokusu odpovídá 1 typ kuličky určený specifickým illumi kódem (adresou). Analyzuje se až 1536 lokusů, v každé miniarrayi máme tedy 1536 typů kuliček, každý typ cca 30x. Na 96 miniarrayích jedné Sentrix Array Matrix analyzujeme současně 96 vzorků DNA. http://www.illumina.com
Jak probíhá vlastní analýza genotypu? GoldenGate Assay 1) Upevnění genomické DNA na paramagnetické kuličky a její denaturace Biotin http://www.illumina.com
2) Allelově specifická extenze a ligace - pro každý lokus navrženy 3 oligonukleotidy: 2 z 5 konce, liší se polymorfním nukleotidem na konci 1 z 3 konce charakterizuje lokus a obsahuje illumicode adresu Genomová DNA [T/C] [T/A] Universal PCR Sequence 1 Universal PCR Sequence 2 A G illumicode Address Universal PCR Sequence 3 http://www.illumina.com
ad 2) Allelově specifická extenze a ligace Genomová DNA [T/C] Ligase [T/A] Polymerase Universal PCR Sequence 1 Universal PCR Sequence 2 A G illumicode Address Universal PCR Sequence 3 http://www.illumina.com
3) Amplifikace+inkorporace fluorescenční barvičky Amplifikace templátu PCR s univerzálními primery Cy3 Universal Primer 1 Cy5 Universal Primer 2 A illumicode #561 Universal Primer P3 http://www.illumina.com
4) Hybridizace na univerzální IllumiCode TM Array illumicode #561 /\/\/\/ illumicode #217 /\/\/\/ illumicode #1024 A/A T/T A/T /\/\/\/ http://www.illumina.com
4) Odečtení výsledků (BeadArray Reader) a interpretace získaných dat http://www.illumina.com
Jak se získaná data využívají? Pro rozsáhlé asociační mapování, které může odhalit genetický základ komplexních dědičných chorob Pro konstrukci genetických map Konsensuální genetická mapa ječmene získaná z 3 DH mapovacích populací na základě Pilot Oligo Pool Assay (OPA1) Mapovací populace - celkem 480 jedinců 1536 SNP genotypováno současně $68,000 za 480 vzorků (5 x 96) 737,280 genotype calls za 3-4 dny 9.2 cents za data-point Při větším počtu vzorků nižší náklady