ENBIK 2014 Od sekvencí k chromozómům: výzkum repetitivní DNA rostlin v Laboratoři molekulární cytogenetiky BC AVČR Jiří Macas Biologické centrum AVČR Ústav molekulární biologie rostlin České Budějovice Biology Centre ASCR, České Budějovice, Czech Republic
Rostliny se liší velikostí svých jaderných genomů Brachyscome dichromo-somatic a 2n = 4 Fritillaria sp. 2n = 24 Myriophyllum spicatum 2n =1 4 Selaginella kraussiana 2n = 40 Equisetum variegatum 2n ~ 216
Rostliny se liší velikostí svých jaderných genomů A. thaliana 130 Mbp Genlisea nigrocaulis 86 Mbp Fritillaria (lilie) >100,000 Mbp rýže 420 Mbp bob 13,000 Mbp hrách 4,100 Mbp ječmen 4,800 Mbp člověk (3,200 Mbp) Geny tvoří jen malou část genomu; většinu jaderné DNA představují opakující se sekvence (repetitivní DNA)
Podíl repetitivní DNA roste s velikostí genomu rostlin Proportion of transposable elements (TE) in plant genomes differing in size Tenaillon, Hollister and Gaut (2010)
Vlivem repetic jsou genomy rostlin velké a z velké části neznámé?
Repetitivní DNA Tandemové repetice Mobilní elementy (transpozóny)
Repetitivní DNA Sekvence, které se v genomu opakují v desítkách až milionech kopií Repetitivní DNA tvoří podstatnou část genomů vyšších rostlin (až > 90% jaderné DNA) a způsobuje většinu rozdílů ve velikostech genomů Na základě uspořádání v genomu se repetice dělí na tandemové a rozptýlené Nejde o zcela náhodně vznikající sekvence, ale o skupiny genetických elementů sdílejících určité mechanizmy vzniku a množení v genomu Tandemové repetice Mobilní elementy (transpozóny)
Má repetitivní DNA v genomu nějakou funkci?
Má repetitivní DNA v genomu nějakou funkci? selfish elements, parasitic DNA?
Má repetitivní DNA v genomu nějakou funkci? selfish elements, parasitic DNA? structural / functional regions of chromosomes telomeres centromeres telomere Pisum sativum Centromeric repeats in rice (Oryza sativa) (Macas et al., 2007) CentO CRR chromosome CentO (satellite) CRR (retrotransposon) (Cheng et al., 2002)
Má repetitivní DNA v genomu nějakou funkci? selfish elements, parasitic DNA? structural / functional regions of chromosomes telomeres centromeres generation of allelic diversity knockout of genes by transposon insertion Cell 60: 115-122, 1990 changes in gene expression patterns Ac/Ds transposon Feschotte (2008) Nat.Rev. Genet. SBEI gene
Vlivem repetic jsou genomy rostlin velké a z velké části neznámé?
Sekvenování genomů rostlin klasické sekvenování
Sekvenování genomů rostlin = Nová generace sekvenačních technologií drasticky zlevnila a zrychlila sekvenování
Sekvenování genomů rostlin Analýza dat Nová generace sekvenačních technologií drasticky zlevnila a zrychlila sekvenování
Laboratoř molekulární cytogenetiky rostlin, BC AVČR Bioinformatics: Development of novel tools for repeat analysis from NGS data Bioinformatics: Next generation sequencing: Repeat analysis in various genomes Illumina 454/Roche PacBio Petr Novák Jiří Macas Jiří Macas Petr Novák Repetitive DNA Cytogenetics: Centromeres: In situ hybridizations and immunodetection Sequence composition; epigenetics; determination Wet-lab techniques: Jasper Manning Iva Fuková Verification of bioinformatic results; cloning, plant transformation, etc... Andrea Koblížková Iva Fuková Iva Fuková Jasper Manning
RepeatExplorer pipeline Bioinformatics: Development of novel tools for repeat analysis from NGS data Petr Novák Jiří Macas
Laboratoř molekulární cytogenetiky rostlin, BC AVČR Bioinformatics: Development of novel tools for repeat analysis from NGS data Bioinformatics: Next generation sequencing: Repeat analysis in various genomes Illumina 454/Roche PacBio Petr Novák Jiří Macas Jiří Macas Petr Novák
Charakterizace repetitivní DNA v různých druzích rostlin Repeat type: Ty3/gypsy Ty1/copia Satellite DNA rdna other/unknown cluster size (% of reads) pea (Pisum sativum) 1C = 4,300 Mb cluster size (% of reads) soybean (Glycine max) 1C = 1,115 Mb Macas et al. (2007) BMC Genomics 8: 427. cumulative % of reads
Charakterizace repetitivní DNA v různých druzích rostlin Repeat type: Ty3/gypsy Ty1/copia Satellite DNA rdna other/unknown cluster size (% of reads) pea (Pisum sativum) 1C = 4,300 Mb Prospero autumnale 1C = 4,400 Mb cumulative % of reads
Charakterizace repetitivní DNA v různých druzích rostlin Repeat type: Ty3/gypsy Ty1/copia Satellite DNA rdna other/unknown Genlisea hispidula 1C = 1,550 Mb Genlisea nigrocaulis 1C = In collaboration with I. Schubert, IPK Gatersleben 86 Mb cumulative % of reads
Laboratoř molekulární cytogenetiky rostlin, BC AVČR Bioinformatics: Development of novel tools for repeat analysis from NGS data Bioinformatics: Next generation sequencing: Repeat analysis in various genomes Illumina 454/Roche PacBio Petr Novák Jiří Macas Jiří Macas Petr Novák Cytogenetics: In situ hybridizations and immunodetection Iva Fuková Jasper Manning
Pohlavní a B-chromozómy rostlin Silene latifolia (2n = 22A + XX/XY) Relative proportions of reads in repeat clusters (Illumina WGS reads from male + female plants) XY (male) equal proportions XX (female) Macas et al. (2011) PLoS ONE 6
Laboratoř molekulární cytogenetiky rostlin, BC AVČR Centromerická varianta histonu H3 (CENH3) Centromeres: Sequence composition; epigenetics; determination Jasper Manning Iva Fuková
Identifikace centromerických repetic pomocí ChIP-seq Illumina seq. (36 nt reads) Outline of the experiment Pisum sativum Isolation of nuclei, digestion with micrococcal nuclease Chromatin immunoprecipitation with CenH3 antibody DNA isolation ( ChIP ) DNA isolation ( INPUT ) Sequencing 9.5 mil. reads Sequencing 20 mil. reads Mapping reads to clusters of long (>100nt) reads, calculating ratio of ChIP / INPUT Cluster = repeat family
Identifikace centromerických repetic pomocí ChIP-seq Illumina seq. (36 nt reads) Outline of the experiment Pisum sativum Isolation of nuclei, digestion with micrococcal nuclease Chromatin immunoprecipitation with CenH3 antibody DNA isolation ( ChIP ) DNA isolation ( INPUT ) Sequencing 9.5 mil. reads Mapping reads to clusters of long (>100nt) reads, calculating ratio of ChIP / INPUT Sequencing Cluster = repeat family 20 mil. reads 100.00 ChIP / input 10.00 1.00 Satellites TR_11 PisTR-B 0.10 0 100 200 300 cluster no. 400 500 600
Laboratoř molekulární cytogenetiky rostlin, BC AVČR Bioinformatics: Development of novel tools for repeat analysis from NGS data Bioinformatics: Next generation sequencing: Repeat analysis in various genomes Illumina 454/Roche PacBio Petr Novák Jiří Macas Jiří Macas Petr Novák http://w3lamc.umbr.cas.cz Cytogenetics: Centromeres: In situ hybridizations and immunodetection Sequence composition; epigenetics; determination Wet-lab techniques: Jasper Manning Iva Fuková Verification of bioinformatic results; cloning, plant transformation, etc... Andrea Koblížková Iva Fuková Iva Fuková Jasper Manning