Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/07.0354

Genomové projekty

SEKVENOVANÉ ROSTLINNÉ GENOMY GROUP GENUS BAC MAP WGS EST Asterids tomato tobacco potato Rosids Arabidopsis thaliana Arabidopsis lyrata Capsella Brassica cotton Medicago Lotus Mimulus poplar Monocots bread wheat sorghum Ae. tauschii barley Saccharum rice Brachypodium maize Gymnosperms Pinus Gnetum Club moss Selaginella

Arabidopsis thaliana Arabidopsis genome inititative (AGI) Sekvenování postupem shora dolů na základě fyzické mapy kosmidových klonů. Osekvenováno cca 115 Mbp (euchromatin) 25 500 genů (11 000 genových rodin). Během evoluce patrně 2x duplikace celého genomu. Geny specifické pro rostlinný genom: - více než 800 jaderných genů je plastidového původu - enzymy pro výstavbu buněčné stěny - enzymy a jiné makromolekuly účastnící se fotosyntézy - produkty uplatňující se při vzniku turgoru, fototropismu a geotropismu - enzymy účastnící se produkce speciálních sekundárních metabolitů - geny pro rezistenci k patogenům The Arabidopsis Information Resource (TAIR) www.arabidopsis.org

GENOMOVÉ PROJEKTY PRO OBILOVINY -přednostně věnována pozornost ekonomicky významným znakům: - znaky související - s výnosem (morfologie zrna, množství semen, doba kvetení) - s kvalitou produktů - odolnost vůči biotickým a abiotickým stresům (prostředí, patogeny) Modelové genomy Rýže Brachypodium 130-470 Mbp

Kukuřice (2,3 Gbp) - na základě sekvence předpovězeno 32 000 genů - 85% genomu transponovatelné elementy Pšenice, ječmen, žito, oves, tritikale - velké komplexní genomy Informace o sekvencích, mapách, markerech, ESTech, knihovnách, literatuře, novinkách databáze GrainGenes, Graminae

GrainGenes is a compilation of molecular and phenotypic information on wheat, barley, rye, triticale, and oats. The project is supported by the USDA-ARS Plant Genome Research Program, and by the community of scientists who are providing the information and the reasons to be interested in it.

Pšenice (Triticum aestivum) allohexaploidní druh 2n=6x=42, genom AABBDD vznikl na základě dvou nezávislých hybridizací Genom cca 110x větší než Arabidopsis, 1 chromozóm větší než celý genom rýže 17,000 Mbp (1C) 1.2% genů

Možné strategie sekvenování a) redukující přístupy - sekvenování ESTů nezachytí celé sekvence a všechny geny - metylfiltrace, sekvenování založené na Cot frakcionaci jen malé obohacení o kódující sekvence, sekvence nelze uspořádat b) shotgun sekvenování není u tak velkého genomu proveditelné c) sekvenování klon po klonu (clone-by-clone sequencing)

K sekvenování klon po klonu jsou nutné knihovny velkých inzertů (BAC, YAC) a fyzická mapa u pšenice za současných technologií není realizovatelná (genomická knihovna pšenice ve vektoru BAC má 1 200 000 klonů!) DNA molekula Fyzická molekulární mapa (bp) Ukotvené markery A B C D E F G Genetická mapa (cm) Fyzická cytogenetická mapa (μm)

Řešení nabízí strategie založená na použití chromozómově specifických knihoven - vytvořeny z jednotlivých chromozómů (ramen) vytříděných pomocí průtokového cytometru AA BB Triticum aestivum (2n = 6x = 42) 1C ~ 17 000 Mbp DD Genome size Arabidopsis thaliana (2n = 2x = 10) 1C ~ 150 Mbp Nuclear genome ; Chromosomes: 605-995 Mbp (3.6 5.9% of the genome) Chromosome arms: 225-585 Mbp (1.3 3.4% of the genome) Umožňuje rozdělit přípravu fyzických map a sekvenování mezi laboratoře.

MEZINÁRODNÍ SPOLUPRÁCE PŘI SEKVENOVÁNÍ ROSTLINNÉHO GENOMU 1A 2A 3A 4A 5A 6A 7A 1B 2B 3B 4B 5B 6B 7B International Wheat Genome Sequencing Consortium 21 chromozómů pšenice seté 1D 2D 3D 4D 5D 6D 7D

Projekt sekvenování lidského genomu

PROJEKT LIDSKÉHO GENOMU (HGP) Zahájen v r. 1990, 3 pětileté plány Původní cíle: 1) Vytvoření genetických a fyzických map o vysokém rozlišení, které pomohou lokalizaci genů spojených s chorobami 2) Získání kompletní sekvence genomu 3) Identifikace genů kombinací vyhledávání ORF, vytváření databází ESTů, využití dat o funkci z jiných živočišných genomových projektů 4) Sestavení databáze polymorfismů, zejména SNP usnadnění integrace genom. a klinických dat studium lidské diverzity a evoluce 5% rozpočtu na výzkum etických, právních a společenských aspektů (projekt ELSI)

Významné milníky 1991 Craig Venter sekvenování ESTů (10 000 ročně) 1992 vzniká TIGR 1994 hustá genetická mapa s 1200 markery po 1cM - v TIGRu osekvenován genom H. influenzae shotgun technikou 1995 fyzická mapa z 52 000 STS po 60 kb - databáze 30 000 ESTů (NIH) - Venter publikuje v Nature podrobné údaje o své sbírce ESTů (175 000 vlastních z 37 tkání, celkem 345 000) 1998 popsána kolekce 3000 SNP (2004 1,8 mil SNP) 2000 kompletní sekvence nejmenšího chromozómu (21)

Hrubé sekvenování ukončeno v r. 2000. V té době odhady počtu genů 20 000-120 000. E. coli S. cerevisiae Drosophila A. thaliana Myš Člověk Velikost genomu (Mb) 4,6 12,0 120+ 115+ 2500+ 3000+ Počet genů 4300 6250 13600 25500 30000 25000 + pouze sekvenovaný chromatin Enzymy účastnící se metabolismu stejný počet jako jiná eukaryota, vzrůstá počet genů s regulačními funkcemi. Zhruba stejný obsah genů jako jiní savci, některé třídy genů dokonce pokles.

Čí genom byl sekvenován? Mezinár. konsorcium Celera > 50 dobrovolných dárců DNA 21 dárců DNA knihovny velkých inzertů (BAC/PAC) vybráno 8 knihoven, vše muži, etnický původ neznámý hierarchické sekvenování knihovny 2-, 10-, 50-kb vybráno 5 knihoven (2 muži, 3 ženy, různý původ) shotgun sekvenování 75% od 1 dárce 66% od 1 dárce

Kdy bude projekt dokončen? Původní cíl - 1 chyba na 10 000 bp. Dnes 99% euchromatinu 1 chyba na 100 000 bp. Rozsáhlé úseky heterochromatinu, zejména centromerického (cca 20% genomu) se možná vůbec nepodaří poskládat.

Internetové zdroje Centrální internetové zdroje koordinovány - Národním centrem pro biotechnologické informace (NCBI) USA - projektem Ensembl spolupráce mezi Evropským bioinformatickým institutem (EMBL-EBI) a Sangerovým centrem ve Velké Británii správa databází, vývoj softwaru, rozšiřování biomedicínských informací, digitální archiv literatury Součástí NCBI je webová stránka OMIM (Online Mendelian Inheritance in Man) integruje genomická data s medicínskými (katalog dědičných nemocí)

ŽIVOČIŠNÉ GENOMOVÉ PROJEKTY International Sequencing Consortium spravuje datábazi živočišných a rostlinných genomových projektů Návrh na sekvenování nového organismu posuzuje NHGRI podle přínosu získaných sekvencí pro biomed. výzkum Jednotlivá sekvenační centra se ucházejí o projekt. Hrubá sekvence živočišného genomu za 3-6 měsíců.

Projekty genomu hlodavců PROČ? 1) Existuje dostatek mutantních kmenů (dobře charakterizované) + možnost mutageneze celého genomu umožňuje genetickou analýzu jakéhokoli lokusu 2) Existuje sbírka cca 100 kmenů laboratorních myší s dobře charakterizovaným rodokmenem umožňuje studium genetické variace a komplexních kvantitativních znaků (asociační mapování) 3) Evoluční pozice hlodavců dost vzdálení konzervované sekvenční bloky jsou indikátorem funkční nutnosti - dost blízcí mnoho aspektů vývoje, fyziologie a genetika jsou podobné

Myš hrubá sekvence r. 2002 Krysa 2004 Mouse genome informatics - web stránka obsahuje - genetické, fyzické a komparativní mapy - údaje o kmenech (včetně údajů o nádorech) a polymorfismech - údaje o genové expresi - rozsáhlý seznam genetických markerů - umožňuje srovnání sekvencí myšího a lidského genomu slouží k identifikaci regulačních míst a pomáhá anotaci genů

DALŠÍ MODELOVÍ OBRATLOVCI Pes r. 2003 - model pro řadu chorob astma, parazitické infekce, rakovina, artritida, cukrovka, poruchy chování Kur domácí r. 2004 - model pro onkogenezi a virologii Primáti: šimpanz (r. 2005), makak - pro studium imunitního systému, mechanismu rezistence proti patogenům (HIV) - pro studium evoluce v genech rozdíl jen 1,2% Skot draft r. 2004, prase draft r. 2005 Modelové ryby: Danio rerio model pro studium embryogeneze, neurogeneze, organogeneze Tetraodon nigroviridis, Fugu rubripes

Paleogenomika Mamut listopad 2008 - použito 454 sekvenování - sekvenováno 28 Mbp metagenomickým přístupem (ze vzorků mamuta ze Sibiře) 13 Mbp opravdu DNA mamuta, zbytek bakterie aj. - homologie se sekvencí slona afrického 98,55%

MODELOVÉ ORGANISMY BEZOBRATLÉ PROČ? - možnost získat mutace ve všech genech saturační mutageneze + konstruce delečních map (Drosophila) - cílená mutageneze - vhodné ke studiu procesu vývoje, ke studiu lidských chorob, včetně psychických poruch Caenorhabditis elegans nematoda tělo 959 buněk Genom přečten r. 1998 97 Mbp, 19 099 genů tvoří 25% genomu, 30% příbuzných s geny člověka. Zejména vhodný ke studiu nervového systému. WormBase web site Drosophila melanogaster 180 Mbp, třetina repetice, 13 500 genů - vysoký stupeň konzervace všech hlavních regulačních a biochemických drah, jež jsou také u kvasinek a vyšších eukaryot FlyBase web site

Geny pro lidské choroby v modelových organismech Modrá Drosophila Oranžová Caenorhabditis Fialová - Saccharomyces Gibson a Muse, 2004