variabilita genomu Nature Science genetická diverzita člověka na úrovni SNP je nízká: asi 0.1% cca. 90% variace je uvnitř populací cca. 10% mezi populacemi (kontinenty) bottleneck
personal genomes James Watson Craig Venter Marjolein Kriek Afričané, Číňané, Korejci, Japonci, genomy nádorů PGP-10 George Church George Church, professor of genetics, Harvard Medical School. Misha Angrist, scientific editor at the Duke Institute for Genome Sciences and Policy in Durham. Keith Batchelder, CEO at Genomic Healthcare Strategies. Esther Dyson, investor and adviser to multiple technology firms. Rosalynn Gill-Garrison, chief science officer at Sciona. John Halamka, chief information officer at Harvard Medical School. Stanley Lapidus, chief executive officer of Helicos. Kirk Maxey, president of Cayman Chemical. James Sherley, stem cell researcher and associate professor, formerly of MIT. individual #10 1000 Genomes (~2500) Wellcome Trust Sanger Institute in Hinxton, England, Beijing Genomics Institute Shenzhen in China, NIH National Human Genome Research Institute (NHGRI)
2001: 2 genomy 2009: 10 genomů 2010: 3,000 genomů 2011: 30,000 genomů odifikováno podle http://www.nature.com/news/2010/101027/pdf/4671026a.pdf
sekvenování nové generace fragmentace DNA ligace adaptorů, denaturace annealing fragmentů na partikule
vytvoření emulze emulzní PCR, denaturace
zachycení partikulí v pikotitrační desce
pyrosekvenace a detekce záblesků
pyrosekvenace a detekce záblesků DNA (n) + dntp (polymeráza) DNA (n+1) + PP i APS + PP i (sulfuryláza) ATP ATP + luciferin (luciferáza) oxyluciferin + dntp, ATP (apyráza) dndp, dnmp, ADP, AMP, P i A T G C A T G C A T G C T G AA T GG A G
sekvenování nové generace 2nd generation: s amplifikací DNA 3rd generation: sekvenace jednotlivých molekul DNA 454/Roche http://www.454.com/ Solexa/Illumina http://www.illumina.com/ SOLiD/ABI http://www.appliedbiosystems.com/ Helicos http://www.helicosbio.com/ Pacific Biosciences http://www.pacificbiosciences.com/ Complete Genomics http://www.completegenomicsinc.com/ http://www.youtube.com/watch?v=77r5p8ibwjk http://www.youtube.com/watch?v=kyagfrbgl6e&nr=1 sekvenování exomů - po "exon capture"
další využití sekvenování nové generace genomy nádorů RNA seq genová exprese, malé RNA (mirna) chromatin immunoprecipitation (ChIP) seq metagenomika, mikrobiomy fetální DNA v mateřské krvi
základní typy mutací ATG ACC CAG CAG CCA ATG AAA Met Thr Gln Gln Pro Met Lys ATG CCC CAG CAG CCA ATG AAA Met Pro Gln Gln Pro Met Lys normální sekvence čtecí rámec je označen mezerami bodová substituce typu missense (threonin je nahrazen prolinem) ATG ACC TAG CAG CCA ATG AAA bodová substituce typu nonsense Met Thr STOP - - - - (předčasné ukončení syntézy proteinu) ATG ACA CAG CAG CCA ATG AAA Met Thr Gln Gln Pro Met Lys ATG --- CAG CAG CCA ATG AAA Met - Gln Gln Pro Met Lys ATG -CCC AGC AGC CAA TGA AA Met Pro Ser Ser Gln STOP - tichá substituce (threonin je kódován jiným kodonem) delece bez posunu čtecího rámce (chybí jedna aminokyselina) delece s posunem čtecího rámce (jiné aminokyseliny + předčasná terminace) ATG ACC CAG CAG CAG CAG CAG CCA ATG AAA Met Thr Gln Gln Gln Gln Gln Pro Met Lys expanze trinukleotidové repetice (vložen polyglutaminový úsek) dynamické mutace
základní typy polymorfismů DNA ATGCCCCAGCAGCCAAT ATGCCCTAGCAGCCAAT polymorfismus typu SNP (Single Nucleotide Polymorphism) chromozóm (jedinec) A chromozóm (jedinec) B tři možné genotypy ATGCCCCACACACACACACAGAAA ATGCCCCACACACACACACACAGAAA ATGCCCCACACACACACACACACACAGAAA polymorfismus typu STR (Short Tandem Repeat) alela A alela B alela C mnoho možných genotypů
typy variability bodové substituce: SNP, bodové mutace malé delece a inserce krátké tandemové repetice polymorfismy typu STR, VNTR dynamické mutace (zejm. expanze trinukleotidů) polymorfní inserce retroelementů velké strukturální varianty: delece, duplikace, inverze (SV - Structural Variants, CNV - Copy Number Variants) většinou submikroskopické přes 10 tis. lokusů, medián několik kb mikrodelečním syndromy často v oblastech segmentálních duplikací referenční sekvence genomu =? klinická interpretace CNV =?
velké fragmenty střední fragmenty malé fragmenty
Southernova metoda restrikční štěpení DNA (pondělí/úterý) gelová elektroforéza (úterý/středa) blotting na membránu (středa/čtvrtek) hybridizace se sondou (čtvrtek/pátek) autoradiografie (pátek/pondělí, nebo déle)
Southern 1975 Northern Western
denaturace DNA hybridizace primerů (annealing) (mají délku kolem 20 bází) syntéza nové DNA termostabilní polymerázou vstup do dalšího cyklu Mullis 1985 PCR Polymerase Chain Reaction po proběhnutí dvou cyklů se jedna molekula DNA zmnoží na čtyři po proběhnutí jednoho cyklu se jedna molekula DNA zmnoží na dvě po proběhnutí n cyklů se jedna molekula DNA zmnoží na 2 n molekul
základní typy polymorfismů DNA ATGCCCCAGCAGCCAAT ATGCCCTAGCAGCCAAT polymorfismus typu SNP (Single Nucleotide Polymorphism) chromozóm (jedinec) A chromozóm (jedinec) B tři možné genotypy ATGCCCCACACACACACACAGAAA ATGCCCCACACACACACACACAGAAA ATGCCCCACACACACACACACACACAGAAA polymorfismus typu STR (Short Tandem Repeat) alela A alela B alela C mnoho možných genotypů
M 1/1 1/2 1/3 2/3 3/3 3/4 M?? 800 300 200 100 378 4 308 3 238 2 168 1 4 3 2 1 identifikace osob paternita jednolokusové sondy
jednolokusové sondy multilokusové sondy
Pemberton & Amos Trends Genet 1990 multilokusové sondy
polymorfismus x mutace ~ varianta definice: polymorfismus nad 1% x mutace pod 1% ale DF508 ~ 1.5% (nosiči CF 1/25, mutace CF 1/50, z toho DF508 70%) 98 95
polymorfismus x mutace ~ varianta neutralita x nepříznivý vliv pro nositele ale projev alely (polymorfismu či mutace) může záviset na prostředí, na genotypu a frekvence polymorfismu/mutace může odrážet selekční tlaky v minulosti, které se dnes již nemusí projevovat výhoda heterozygotů závislost na genotypu (heterozygot, homozygot) závislost na prostředí (černoši v Americe)
polymorfismus x mutace ~ varianta alela původní (ancestrální) x alela nově vzniklá ( mutací ) nelze se opřít o dnešní frekvenci, ancestrální alela může být z populace odstraněna persistence laktázy persistence laktázy x intolerance laktózy i kulturní prostředí může určovat, který genotyp je výhodný a který ne Jobling, Hurles, Tyler-Smith: Human Evolutionary Genetics
sestřihové mutace 1 2 3 4 5 6 7 8 9 GT AG 1 2 3 4 5 6 7 8 9 GT AT syndrom sousedících genů (contiguous gene syndrome)
hot-spots pro variabilitu dinukleotid CG (CpG): me CG mutuje na TG tandemové repetice: sklouznutí při replikaci (slippage) rozptýlené repeaty: rekombinace mezi nealelními kopiemi ATG ACG CAG CAG CCC CCT ATG AAA Met Thr Gln Gln Pro Pro Met Lys ATG ATG CAG CAG CCC CCT ATG AAA Met Met Gln Gln Pro Pro Met Lys ATG ACG CAG CAG CCC CTA TGA AA Met Thr Gln Gln Pro Leu STOP - ATG ACG CAG CAG CAG CAG CAG CCC CCT ATG AAA Met Thr Gln Gln Gln Gln Gln Pro Pro Met Lys
vzorky 1-4: úplná komplementarita, sonda hybridizuje vzorek 5: neúplná komplementarita, sonda nehybridizuje 1 2 3 4 5 alelově specifická hybridizace hybridizace s alelově specifickými oligonukleotidy (ASO) 1 2 3 4 5 DNA čipové technologie: paralelní hybridizace s mnoha oligonukleotidy (nebo delšími klonovanými sondami) rozmístěnými hustě na pevném podkladu
DNA čipové technologie: resekvenace GCGGCATGAACCGTAGGCCCATC 5 3 3 5 GCCGTACTTGGAATCCGG GCCGTACTTGGCATCCGG GCCGTACTTGGGATCCGG GCCGTACTTGGTATCCGG GCCGTACTTGG-ATCCGGG CCGTACTTGGCATCCGGG CCGTACTTGGCCTCCGGG CCGTACTTGGCGTCCGGG CCGTACTTGGCTTCCGGG CCGTACTTGGC-TCCGGGT
5 CGGCGCACAGAGGAAGAGAATCTCCGCAAG 5 CGGCGCACAGAGGAAGAGAATCTCCGCAAG 3 3 3 CCGCGTGTCTC-TTCTCTT 5 3 CCGCGTGTCTCTTTCTCT 5 3 CCGCGTGTCTCGTTCTCT 5 3 CCGCGTGTCTCCTTCTCT 5 del 3 CCGCGTGTCTCATTCTCT 5 T G C A
3 CCGCGTGTCTC-TTCTCTT 5 3 CCGCGTGTCTCTTTCTCT 5 3 CCGCGTGTCTCGTTCTCT 5 3 CCGCGTGTCTCCTTCTCT 5 del 3 CCGCGTGTCTCATTCTCT 5 T G C A
5 CGGCGCACAGAGGAAGAGAATCTCCGCAAG 5 CGGCGCACAGAGAAAGAGAATCTCCGCAAG 3 3 3 CCGCGTGTCTC-TTCTCTT 5 3 CCGCGTGTCTCTTTCTCT 5 3 CCGCGTGTCTCGTTCTCT 5 3 CCGCGTGTCTCCTTCTCT 5 del 3 CCGCGTGTCTCATTCTCT 5 T G C A
3 CCGCGTGTCTC-TTCTCTT 5 5 GCGCACAGAGAAAGAGAATC 3 3 CCGCGTGTCTCTTTCTCT 5 3 CCGCGTGTCTCGTTCTCT 5 3 CCGCGTGTCTCCTTCTCT 5 del 3 CCGCGTGTCTCATTCTCT 5 T G C A
homozygot pro normální sekvenci (GAA = Glu) 5 CGGCGCACAGAGGAAGAGAATCTCCGCAAG 5 CGGCGCACAGAGGAAGAGAATCTCCGCAAG 3 3 del T G C A heterozygot pro mutovanou sekvenci (GAA = Glu / AAA = Lys) 5 CGGCGCACAGAGGAAGAGAATCTCCGCAAG 5 CGGCGCACAGAGAAAGAGAATCTCCGCAAG 3 3 del T G C A
www. affymetrix.com
G C A C A G A G G A A A G A G A A C G T del heterozygot pro mutovanou sekvenci TP53 (kodon 286: GAA = Glu / AAA = Lys)
neznačená testovaná DNA 3 TTCTCTTAGAGGCGTTCTT 5 T extenze oligonukleotidu zakotveného v buňce čipu o jeden značený dideoxynukleotid
homozygot pro normální sekvenci (286 GAA (Glu)) 5 CGGCGCACAGAGGAAGAGAATCTCCGCAAG 5 CGGCGCACAGAGGAAGAGAATCTCCGCAAG 3 3 červený fluorescenční signál v buňce B heterozygot pro mutovanou sekvenci (286 AAA (Lys)) 5 CGGCGCACAGAGGAAGAGAATCTCCGCAAG 5 CGGCGCACAGAGAAAGAGAATCTCCGCAAG 3 3 červený + modrý fluorescenční signál v buňce B
286 Glu/Glu 286 Glu/Lys
FAMILY 7 * proven carrier proven non-carrier childhood cancer I. 1 2 pancreatic cancer (47y) * breast cancer (50y) GERMLINE p53 MUTATION IN FAMILY 7 Glu286Lys (exon 8) wild type II. 1 * 2 G A G G A A G A G 285 286 287 Glu Glu Glu thyroid cancer (18y) III.1 blood III. 1 * rhabdomyosarcoma (3y) non-hodgkin lymphoma B (7y) 2 G G A G A A A G A G 285 Glu 286 Glu 287 Glu Lys
normální DNA DNA nádoru CGH comparative genome hybridisation
DNA čipové technologie: počet kopií v genomu (copy number) array CGH normální DNA DNA nádoru
G C A C A G C G A A T G G G A C G G T G A A C C A C G 17p 17q
fluorescenční in situ hybridizace (FISH)