NOVÉ METODY SEKVENOVÁNÍ
První generace Sangerovo sekvenování (dideoxy metoda) od roku 1977 Druhé generace Next-generation sequencing (masivní paralelní sekvenování) od roku 2005 Roche 454 (pyrosekvenování) Illumina (metoda cyklické reverzibilní terminace) IonTorrent, Solid AB Třetí generace sekvenace jedné molekuly DNA, od roku 2012 Pacific Biosystems PacBio (SMRT single molecule real time)
Pyrosekvencování DNA polymerasa dntp mix ATP sulfurylasa Adenosine 5 fosfosulfát Luciferasa Luciferin Apyrasa http://www.youtube.com/watch?v=nffgwgfe0aa
I. Izolace genomové DNA a fragmentace na vhodné úseky(300-800 bp) II. III. IV. Zatupení konců a navázání adaptorové sekvence s biotinovou značkou (modrá) a druhé bez (červená) Navázání na kuličky se streptavidinem Provedení emulsního PCR (červený a modrý primer) V. Nanesení na mikrotitrační destičku VI. Paralelní pyrosekvencování ve všech jamkách
empcr zesílení signálu
Příprava mikrotitrační desky
Roche 454/GS FLX Sequencing Technology
Illumina metoda cyklické reverzibilní terminace Příprava knihovny zatupení konců fosforylace 5'konců A - přesah na 3'konci TA navázání adaptorů
Illumina Hybridizace ssdna templátu na čip 1. ssdna templát hybridizuje na kovalentně navázanou čipovou próbu A 2. Polymerace probíhá extenzí navázané próby A
Illumina Generování klonálních klastrů (zesílení signálu) 1. dsdna je denaturována 2. Nově syntetizovaný řetězec je kovalentně navázán Nově syntetizovaný řetězec 3. Templát je odmyt discard
Illumina Generování klonálních klastrů 1. 3'konec templátu hybridizuje s próbou B 2. Tvorba "bridge" můstku 3. Polymerace probíhá opět extenzí od próby B komplementární adaptorová sekvence
Illumina Generování klonálních klastrů 1. dsdna je denaturována Výsledek: dva kovalentně navázané komplementární řetězce Opakování cyklů
Illumina Generování klonálních klastrů místo štěpení
Illumina Generování klonálních klastrů Reverse řetězec je odmyt a zůstavá navázán pouze forward
Generování klonálních klastrů blokace 3'konce blokace 3'konce blokace 3'konců zabraňuje extenzi při nespecifickém navázání primerů během vlastní sekvenace
Bridge PCR
cyklická reverzibilní terminace Chemické štěpení ve vodném prostředí za katalýzy paladiem DEALLYLACE
pg10 PacBIO single molekulové čtení SMRT (Single molecule real-time) - nukleotidy značeny čtyřmi fluorochromy - velmi citlivá detekce - sekvenace v milisekundách a zeptolitrech
Snímek 18 pg10 A ZMW is a hole, tens of nanometers in diameter, fabricated in a 100nm metal film deposited on a glass substrate. The small size of the ZMW prevents visible laser light, which has a wavelength of approximately 600nm, from passing entirely through the ZMW. Rather than passing through, the light exponentially decays as it enters the ZMW. Therefore, by shining a laser through the glass into the ZMW, only the bottom 30nm of the ZMW becomes illuminated. Within each ZMW, a single DNA polymerase molecule is anchored to the bottom glass surface using a proprietary technique. Nucleotides, each type labeled with a different colored fluorophore, are then flooded above an array of ZMWs at the required concentration. Diffusion at the nanoscale is incredibly fast. Within microseconds, labeled nucleotides travel down into the ZMW, surround the DNA polymerase, then diffuse back up and exit the hole. As no laser light penetrates up through the holes to excite the fluorescent labels, the labeled nucleotides above the ZMWs are dark. Only when they diffuse through the bottom 30nm of the ZMW do they fluoresce. When the correct nucleotide is detected by the polymerase, it is incorporated into the growing DNA strand in a process that takes milliseconds in contrast to simple diffusion which takes microseconds. This difference in time results in higher signal intensity for incorporated versus unincorporated nucleotides, which creates a high signal-to-noise ratio. Thus, the ZMW has the ability to detect a single incorporation event against the background of fluorescently labeled nucleotides at biologically relevant concentrations. galuszka; 13.3.2012
Illumina/Solexa - vyhodnocení
SROVNÁNÍ platforma Příprava templátu chemismus Délka jednoho čtení (bp) Doba běhu Kapacita Runu Gb Cena přístroje (USD) ROCHE 454 Fragmentace + emulsní PCR pyrosekvenování 700 8 hod. 0.5 500.000 ILLUMINA Fragmentace + bridge PCR Cyklická reverz. terminace 100 9 dní 120 654.000/1 20.000 PacBIO fragmentace SMRT 1700 hodiny 0.05 695.000 SOLID Fragmentace + emulsní PCR Sekvenace ligací 50 14dní 50 600.000 ROCHE 454 ILLUMINA PaCBIO + dlouhé běhy, lze dělat i de novo nekomplikované genomy (mikroorganismy) + rychlé -- chyby v homopolymerních repeticích (AAAAAAAAA, GGGGGGGGGGG) + nejpoužívanější + obrovský rozsah, resekvenace celého genomu v jednom běhu -- nízká multiplexita + velmi levné, nejdelší čtení -- vysoká chybovost
1 největší význam DIAGNOSTIKA zlevnit přesekvenování lidského genomu na 1.000 USD (do roku 2015) (nové levnější přístupy: SOLID Applied Biosystems, HELIOS) CANCER GENOME ATLAS kromě SNP a mutací, míra exprese, metylace, copy number variants TRANSCRIPTOME SEQUENCING (RNA-seq) výhoda oproti DNA čipům je že 100% postihuje alternativní sestřih a alelickou variabilitu SINGLE MOLECULE SEQUENCING (Helios, PacBio) preinplantační diagnostika SOLID PHASE CAPTURE NimbleGene čip vyrobený pro vychytání kodujících sekvencí a regulačních oblastí z rozfragmentované genomické DNA před vlastním sekvenováním
Snímek 22 1 The project scheduled 500 patient samples, more than most genomics studies, and used different techniques to analyze the patient samples. Techniques include gene expression profiling, copy number variation profiling, SNP genotyping, genome wide DNA methylation profiling, microrna profiling, and exon sequencing of at least 1,200 genes. TCGA is sequencing the entire genomes of some tumors, including at least 6,000 candidate genes and microrna sequences Doc. Mgr. Petr Galuszka, Ph.D.; 13.11.2016
HapMap (haplotype mapping) konsorcium vědců ze 6 států mezinárodní program mapující lidskou druhovou variabilitu od roku 2002 se sestavují mapy vzorců SNP vyskytující v rámci populací jednotlivých ras v Africe, Asii a Spojených státech cílem je dramaticky snížit celkový počet nalezených SNP (3.000.000) selektování těch, které souvisejí s geneticky podmíněnými nemocemi 1000 Genome Project
Nextgenové sekvenování umožnilo rozvoj metagenomiky: Rychlé a levné sekvencování genomů jednotlivců Nelze sekvencovat neznáme genomy, kvůli obtížnosti přiřazení (repetice) pouze ty u kterých je znám homologický genom (stejného biologického druhu) Metagenomika studium biologické rozmanitosti a genetického materiálu celé komunity (mikro)organismů přímo v jejich přirozeném prostředí bez nutnosti jejich kultivace v laboratoři (např. z půdy, střevní mikroflora) Metagenom celková genetická informace komunity organismů X Genom celková genetická informace jednoho organismu
Střevní mikroflóra P. J. Turnbaugh et al. (2006) An obesity-associated gut microbiome with increased capacity for energy harvest. Nature. Dec 21;444(7122):1027-31. Apendikální mikrobiální DNA z ob/ob, ob/+, +/+ myši Složení mikroflóry střeva závislé na obezitě změny v zastoupení bakteriálních kmenů Bacteroidetes a Firmicutes změny v metabolickém potenciálu střeva (ukládání energie)
DNA mamuta - Mammoth Project Hendrik N. Poinar et al (2006): Metagenomics to Paleogenomics: Large-Scale Sequencing of Mammoth DNA. Science Jan. 20, 311 (5759): 392-394. DNA extrahována z 1 g mamutí kosti (28000 let, Siberia) 100 ml DNA fragmenty 500 700 bp 454 sekvenování 28 miliónů bp 302 692 čtení 45,4% čtení se přirovnalo se sekvencí slona afrického, 1,4% - s lidskou a 1,2% se psí sekvencí.
De novo assembly nových genomů pomocí nextgenového sekvenování Mate-pair a pair-endové knihovny Kombinace dvou platforem s krátkým a dlouhým čtením Vhodný softwarový nástroj
Next-gen sequencing de novo Genome assembly Claviceps truncatispora NO EAS GENES DETECTED Claviceps africana RNA-seq Claviceps purpurea transcriptome from different stages during infection: germinated spore in ovary sfacelium sclerotium mycelium
Biosynthesis of cytokinins in Claviceps? CPUR01476 - CK-sp.CYT450 IPT CPUR01477LOG CPUR02269 LOG
Comparative genomic of cytokinin cluster in genus Claviceps C. purpurea 5.000bp CPUR04171 CPUR04172 CPUR04173 CPUR04174 CPUR04175 CPUR04176 CPUR04177 CPUR04178 NIPA-like protein SRP40 Unknown protein Adenosine deaminase HsBA CK-specific cytochrome P450 IPT LOG Proteasome activator C. fusiformis SRP40 Unknown protein Adenosine deaminase HsBA CK-specific cytochrome P450 FAD containing monooxygenase IPT LOG Proteasome activator C. africana Adenosine deaminase CK-specific cytochrome P450 FAD containing monooxygenase NIPA-like protein SRP40 Unknown protein IPT LOG Proteasome activator Yeast ADA is able to degradate cytokinins with reaction rate 1/10 of ADO indole-3-pyruvate monooxygenase (YUCCA) auxin biosynthesis C. paspali C. truncatispora FAD containing monooxygenase IPT LOG Proteasome activator CK-specific cytochrome P450 Proteasome activator Unknown protein Proteasome activator LOG IPT FAD containing monooxygenase
DIAGNOSTIKA ChIP-seq (chromatin imuno precipitation) Methyl-seq detekce CpG oblastí (epigenetika) využívá konverze cytidinu na uridin za pomocí bisulfidu methylovaný cytidin není konvertován
ODCHYLKY V METHYLACI Illumina nabízí Whole-genome bisulfite sequencing (WGBS)