MUTAGENEZE in vitro postupy kterými se mění primární struktura DNA, především ř za účelem fenotypové změny Mutace gen transkripce translace mutace normalní protein normální fenotyp mutovaný gen abnormální protein částečně funkční nefunkční žádný změněný fenotyp 1
BODOVÉ Typy mutací DELECE INZERCE INVERZE TRANSLOKACE Mutace na genové úrovni MUTACE BEZ PROJEVU 5 ATG GGA GCT CTA TTA ACC TAA 3 met gly ala leu leu thr stop MUTACE SE ZTRÁTOU SMYSLU 5 ATG GGA GCT CTA TTA ACC TAA 3 met gly ala leu leu thr stop 5 ATG GGA GCT CTA TTG ACC TAA 3 met gly ala leu leu thr stop 5 ATG GGA GCT CTA TGA ACC TAA 3 met gly ala leu stop ZMĚNA JEDNÉ AMINOKYSELINY 5 ATG GGA GCT CTA TTA ACC TAA 3 met gly ala leu leu thr stop MUTACE S POSUNEM ORF 5 ATG GGA GCT CTA TTA ACC TAA 3 met gly ala leu leu thr stop 5 ATG GGA GCT CTA TTT ACC TAA 3 met gly ala leu phe thr stop 5 ATG GGG AGC TCT ATT AAC CTA A 3 met gly ser ser ile asn leu 2
Mutace na úrovni organismu Letální mutace organismus umírá v důsledku změněného nebo chybějícího produktu genu. Může být letální na základě okolních podmínek Mutace způsobí pouze částečnou změnu funkce genu (např. snížení aktivity) Mutace genu jehož funkce není pro buňku esenciální nebo může být nahrazená genem podobným (genová rodina) Skrytá mutace (bez efektu) PSEUDOGENY 1) Procesované (nebo retrotransposované) pseudogeny vznikly reverzní transkripcí z RNA a zabudováním do genomu 2) Neprocesované (nebo duplikované) pseudogeny vznikly duplikací a následnýma spontánníma mutacema 3) Jedinečné pseudogeny jedinečné, důležité v evoluci. např. gulonolakton oxidasa pro biosyntézu vitamínu C 3
REVERZE Proces kdy mutant získá zpět wild-typový fenotyp, dvě cesty: 1. zpětná mutace (přesná, málo častá) 2. supresorová mutace (mutace na jiném místě genu, která potlačuje (supresuje) původní mutaci. Mutant se nazývá REVERTANT. Je častá u mutací s posunem ORF. Amesův Test test měří mutagenicitu různých látek jako zvýšenou frekvenci spontánní POUŽITÍ: testování nových látek na mutagenitu, potravinářská aditiva, pesticidy, id kosmetika atd. reverze mutanta his- to his+ Test chemikálie + bakterie minimální medium bez histidinu 48 hrs histidin-vyžadující mutant (his-) Salmonella typhimurium Backgroundová spontánní REVERZE Chemicky indukovaná REVERZE 4
PG2 TRANSPOZOMY mobilní elementy DNA které se pohybují v rámci genomu, s četnosti 10-7 až 10-2 přenosu na generaci. tento přenos je TRANSPOZICE pokud se tento transpozom dostane do genu chová se jako inzertní mutace, s tím že tuto mutaci nelze vrátit zpět reverzí. gen rezistence k antibiotiku IS Element IS Element transpozice je řídký jev, můžeme však do transpozomu vložit gen pro rezistenci k antibiotiku, využívá se při mutaci zprostředkované transpozomem Transpozomy jsou důvodem proč spousta kmenů bakterií v nemocnicích je rezistantní vůči širokému spektru antibiotik. Většina resistence je buď na plasmidech nebo transpozomech, které se mohou mezi jednotlivými kmeny vyměňovat, což je posíleno selekčním tlakem prostředí (spousta antibiotik v nemocnici). Staphylococcus aureus SPONTÁNNÍ MUTACE mutace je náhodný proces obecně dochází ke spontánní mutaci s pravděpodobnosti 10-6 až 10-9 na gen za jednu generaci každý gen mutuje s jinou pravděpodobností (pozice v genomu) mutace ovlivňující fenotyp je ještě daleko řidší pravděpodobnost reverze je daleko nižší než přímé mutace EVOLUCE letitý spor zda je variabilita mezi organismy způsobena ADAPTACI NA PROSTŘEDÍ nebo SPONTÁNNÍMI MUTACEMI a až zpětnou adaptaci působení fága FLUKTUAČNÍ TEST spontánní mutace vznikají chybou v replikaci DNA, 3-5 exonukleasová (PROOF- READING) aktivita DNA polymeras (ne u PCR!) 1943 5
Snímek 9 PG2 zlatý stafylokok jedine ucinne antibiotikum je vancomycin galuszka; 04/03/2008
GENETICKÉ MAPOVÁNÍ často používaná metoda pro zjišťování funkce neznámých genů náhodná mutageneze semen Arabidopsis způsobující fenotypovou změnu mutagen ethylmethan sulfonát (EMS), záření rentgenové nebo gamma. 40.000 semen se pěstuje a pozoruje fenotyp - M1 generace, mutace je heterozygotní. M1 generace se samozkříží a semena se seberou. M2 semena se vysejí a mutanti s požadovaným fenotypem identifikují (ti co produkují pouze potomstvo s fenotypem jsou homozygotní na mutaci). GENETICKÉ MAPOVÁNÍ I 121.4 cm II 99.1 cm III 101.7 cm IV 92.0 cm V 104.0 cm nga 63 nga 126 nga 225 nga 8 nga 151 G4711 DET1 GAPB nga 280 GPA1 nga 168 NIT1 CH42 PRHA nga 139 DFR mutace a její pozice? nga 111 I-V 518.2 cm mapa Arabidopsisových molekulárních markerů 6
GENETICKÉ MAPOVÁNÍ mutaci mapujeme pomocí molekulárních markerů u Arabidopsis thaliana ekotyp Columbia další rozšířený ekotyp Arabidopsis thaliana je Landsberg erecta pomocí ídna markerů ů můžeme rozlišit mezi těmito dvěmi ě ekotypy existuje na 50.000 sekvenčních polymorfismů mezi ekotypy Landsberg erecta a Columbia a jejich pozice na chromozomech je přesně známa. tyto rozdíly se detekují především pomocí PCR variabilita v rámci inzertů a delecí způsobující rozdílnou délku amplifikovaných fragmentů, nebo vznikem nového restrikčního místa. příklad polymorfismu mezi Landsberg erecta a Columbia vznik nového restrikčního místa DraI v PCR produktu markeru crossing over a rekombinace během meiozy při tvorbě gamet u heterozygotů (výměna části chromozomů) x Strain 1 Columbia mut (-/-) Strain 2 Landsberg mut (+/+) F1 rostliny mut (-/+) x markery ve vazbě BACK CROSSING mut { mut (-/-) mut (+/-) F2 semena 7
GENETICKÉ MAPOVÁNÍ homozygotní selektovaný mutant ekotypu Columbia homozygotní nemutovaný ekotypu Landsberg erecta heterozygot tzv. BACKCROSSING (zpětné křížení s mutantem) semena v F2 generaci poskytující mutantní fenotyp musí být homozygoti vzniklí crossing overem četný genotyp marker A není ve vazbě s mutaci vzácný genotyp marker B je ve slabé vazbě s mutaci velmi vzácný genotyp marker C je ve vazbě s mutaci četnost genotypu po crossing overu analýza zpětně zkřížených mutantů frekvence rekombinace (RF) mezi mutovaným lokusem a různými markery RF [%] = # chromozomů Landsberg / # celkový počet chromozomů x 100 čím nižší procento, tím silnější vazba marker I ve vazbě 5 mutantů 1/10x100 = 10% marker II bez vazby na mutaci 6 mutantů 5/12x100 = 58% většinou se analyzuje až 1000 zpětně zkřížených mutantů, ten s nejméně četným genotypem na testovaný marker pro druhý ekotyp má tento marker nejblíže mutaci určení dvou nejbližších markeru a následná sekvenace chromosomu mezi a nalezení hledané mutace resp. genu nesoucího tuto mutaci 8
PG1 pg9 GENETICKÉ MAPOVÁNÍ člověk shromážděno největší dostupné množství příslušníků rodin ve kterých se nachází znak (nemoc), kterou chceme mapovat určit gen, který nemoc způsobuje. ů Odebrány vzorky krve, izolována DNA a provedeno PCR na zhruba 200 genových markerů - polymorfismů (pokrývající celý genom 7.5 - cm od sebe) nalezen nejbližší marker tzn. jedna forma (alela) se nejčastěji vyskytuje u nemocného a u jeho zdravých sourozenců se nejčastěji vyskytuje druhá forma (marker ve vazbě k mapovanému genu nejmenší pravděpodobnost crossing overu) 2 kolo provedeno PCR na další nejbližší markery v nejbližším okolí markeru nalezeného v prvním kole testování. nakonec nalezeny dva nejbližší markery a DNA mezi nimi sekvencována u nemocného jedince a porovnána se zdravým. PG1 GENETICKÉ MAPOVÁNÍ člověk - příklad Geny ve vazbě 2/13 transkripční faktor LMX1B 9
Snímek 17 PG1 pg9 1cM je vzdálenost dvou genů mezi kterými dochází k 1% rekombinaci na generaci u člověka je to zhruba 1.000 kb galuszka; 05/03/2006 markery ve vzdalenosti 1cM maji behem jedne generace 1% sanci ze se od sebe oddeli pomoci crossing overu galuszka; 28/02/2010 Snímek 18 PG1 lide co maji NPS maji v rodine stejnou krevni skupinu to se zjistilo, pak se tedy testovaly markery v okoli genu pro krevni skupinu az se nasly dva nejblizsi Petr Galuszka; 20/02/2007
GENETICKÉ MAPOVÁNÍ myš Inbrední linie myší homozygotní téměř ve všech lokusech, vzniká křížením sourozenců minimálně po 20 generací Kongenní myš vzniklá zpětným křížením potomstva dvou inbredních linií, z niž jedna nesla znak, který chceme alokovat, minimálně přes deset generací a selekcí na sledovaný znak Velikost diferenciálního segmentu v průběhu kongenizace Alokace lokusů pomocí rozdílnosti mikrosatelitních markerů u jednotlivých inbredních myších linií Průměrná vzdálenost u myší 6.7 cm 10
MUTACE CÍLENÁ studuje efekt změny v genetickém materiálu - modifikace promotorové sekvence za účelem studia účinnosti transkripce - studium významu jednotlivých AK v proteinu zlepšování kvality např. expresního systému KOZAKOVÁ SEKVENCE je důležitá pro efektivitu translace (umožňuje pevnou vazbu malé ribozomální podjednotky na mrna) u eukaryot. -6-5 -4-3 -2-1 start codon +4 +5 +6 Kozak seq. U A A A C A A U G G C U 60% 100% 70% AtCKX1 G U A G A A A U G G G A AtCKX2 A A A C A A A U G G C U HvCKX2 A G A G C C A U G A G G nebo proteinu, který exprimujeme změna jedné nebo i více aminokyselin může zlepšit kvalitu či aktivitu léčiva (enzymu) A) mutace místně cílená (site-directed mutagenesis) gen, či sekvenci kterou budeme chtít mutovat, je třeba naklonovat do vhodného vektoru navržení dvou komplementárních primerů, v místě kde chceme mutovat, nesoucí tuto mutaci Stratagene M G A L L W L původní sekvence 5 ATG GGA GCT CTA TTA ACC TTA 3 forward primer 3 TAC CCT CGA GAT AAT TCG AAT 5 reverse primer 5 ATG GGA GCT CTA TTA AGC TTA 3 M G A L L S L PCR s těmito primery na templátový plasmid a s Pfu p y p ý p polymerasou vytváří se nové cirkulární DNA nesoucí mutaci, jsou k sobě komplementární a drží u sebe, mají přerušení v místě konce primerů (tzv. nick) ošetření restrikční endonukleasou DpnI (štěpí pouze methylovanou DNA, templátový plasmid) transformace do bakterie a namnožení mutovaného plasmidu 11
TRANSFORMACE baktérii a kvasinek přímý genetický přenos informace (DNA) z okolí do organismu buňka schopná přijmout DNA (plasmid) se nazývá KOMPETENTNÍ přirozeně kompetentní jsou některé kmeny Bacillus subtilis, Hemorheae influenze atd. všechny ostatní se mohou transformovat po uvedení do kompetentního stavu dvěma ě způsoby: A) ELEKTROPORACE B) CHEMICKÁ METODA buňky se pořádně promyjí dih 2 O smíchají s plasmidovou DNA rozpuštěnou také v dih 2 O a vloží do elektroporátoru buňky se ošetří roztokem rubidné a vápenaté soli, které způsobují větší permeabilitu membrány DNA se smísí s těmito buňkami a provede se tzv. HEAT SHOCK (45 sec. 42 C) EFEKTIVITA NÁROČNOST využití mutageneze při studiu regulačních sekvencí genů vytvoření konstruktu studovaného promotoru a reportérového genu promotor reportérový gen vytvoření mutantů pro skenování promotorové aktivity DNA transformace každého konstruktu do buněk lýze buněk a měření aktivity reportérového genu 12
využití mutageneze při studiu regulačních sekvencí genů konstrukt aktivita reportérového genu reportérové geny: ß-galaktosidasa (kolorimetricky) CAT (chloramfenicolacetyl transferasa) (kolorimetricky) luciferasa (luminiscenčně) C) mutace kazetová 13
C) mutace kazetová C) mutace kazetová dvojitá 14
PG7 D) mutace supresorovou trna mutace se ztrátou smyslu (mutace na stop kodon) muže být potlačená tzv. supresorovou trna existují mutantní trna geny (mutace v antikodonu), které rozpoznávají tyto kodony jako funkční a začleňují do vznikajícího polypetidu místo ukončení další AK tzv. supresorové trna. ty mohou být pro libovolnou AK, používají se např. pro vnášení speciálních AK do proteinu (nutno vnést i nový gen pro aminoacyl trna syntasu) CÍLENÁ MANIPULACE GENOMU -příprava knockoutovaných linií organismů HR homologní rekombinace NHEJ nehomologní lepení konců 15
Snímek 29 PG7 V užším smyslu se tento termín používá pro mutace v genech pro trna, hlavně v sekvenci antikodonu, které umožňují čtení stop kodonů a tím expresi genů přerušených stop kodonem Supresorové mutace byly popsány a prozkoumány u baktérií, ale u eukaryot se vyskytují také, a jsou důležitým genetickým nástrojem. Umožňují studovat mutace, které by v divokých kmenech byly letální, což je důležité zejméně u bakteriofágů. Pro ně je typický úsporný genom, ve kterém je téměř každý gen esenciální, takže mutace v kterémkoli způsobí, že se fág nemnoží a nemůžeme ho studovat (ani jeho mutace). Objevení supresorových kmenů baktérií umožnilo identifikovat vhodné nonsense mutace fágů (mutanty rostou jen v supresorových kmenech), napěstovat mutovaného fága a ve velkém infikovat divoký kmen. Rozborem infikovaných baktérií se zjistí, kde je mutace: např. hromadí se se jen hlavy fága - mutace je v bílkovině bičíku. Dá se snadno určit i ve které konkrétní bílkovině mutace je (nevzniká). Pro zachování životaschopnosti baktérie je nezbytné, aby mutovaná trna byla jen jednou z více trna pro danou aminokyselinu. I tak má supresorová mutace škodlivý efekt: způsobuje čtení správných stop kodonů, kterým vznikají delší, často nefunkční proteiny. Ale velká pravděpodobnost náhodného výskytu jiného stop kodonu blízko za původním, nízká koncentrace mutované trna a její soutěž o stop kodon s release faktorem škodlivý efekt snižují. galuszka; 03/03/2009
ZINC FINGER NUCLEASES chimerické proteiny vytvořené spojením Fok I nukleasy a specifických sekvencí zvaných zinkové prsty ZINC FINGER NUCLEASES 16
Testování specifity ZFN Knock-out genu pomocí ZFN Shukla et al (2009): Precise genome modification in the crop species using ZFN. Nature 459 17
SEKVENCOVÁNÍ GENOMŮ SEKVENCOVÁNÍ GENOMU příprava knihovny sekvencování jednotlivých klonů sestavení genomu vyplnění mezer předpovězení genů anotace genů analýza genomu (srovnávací a integrační) 18
SEKVENCOVÁNÍ GENOMU mapování genomu (chromozomu): genomové mapování bylo umožněno objevem specifických abundantních genetických markeru (mikrosatelitů) do 1994, bylo na lidské genomové mapě lokalizováno: 5.264 mikrosatelitů na 2.335 chromozomových lokusech (průměrná vzdálenost mezi markery je 599 kb) bylo také odsekvenováno tisíce STS sequence tagged site (STS) genetická mapa 5.264 mikrosatelitů SEKVENCOVÁNÍ GENOMU Dva typy přístupů pro sekvencování genomů: 1. Metoda PROCHÁZENÍ CHROMOZOMU (Chromosome walking) vychází z mapy genomu, začíná se od markeru a sekvencuje se klon za klonem levné, ale zdlouhavé t j í k ih pro sestrojení knihovny se používají BAC vektory (kapacita 300kb) 19
SEKVENCOVÁNÍ GENOMU 2. Metoda SHOTGUN SEKVENCOVÁNÍ vytvoření BAC klonů pro každý chromozom (jeden lidský chromozom se vejde asi do tři stovek BAC klonů). rozrušení inzertů (Sau3AI, nebo kombinace RE), separace na gelu podle délek a překlonování ±2kbp fragmentů do normálních plasmidových vektorů koncové sekvencování pomocí univerzálních vektorových primerů sekvenace všech inzertů (jedna sekvenační reakce umožní přečtení max. 700 bází) počítačové poskládáni překrývajících se úseků (kontigů) do větších celků a vytvoření superkontigů (superrychlé počítače) drahá, ale rychlá metoda (většina velkých genomů byla odsekvencována takto) SEKVENCOVÁNÍ GENOMU genom plazmidy (2 10 Kbp) náhodné štípání kosmidy (40 Kbp) BAC (300Kbp) ~500 bp ~500 bp ~500 bp ~500 bp koncové sekvenování (500-700 bp) 20
SEKVENCOVÁNÍ GENOMU SEKVENCOVÁNÍ GENOMU U VELKÝCH EUKARYOTICKÝCH GENOMŮ JE S 2 kb KLONOVANÝMI ÚSEKY PROBLÉM velikost repetitivních sekvencí může být až 5 kb mnoho 2 kb klonů proto obsahovalo dlouhé repetitivní sekvence výsledkem bylo zastavení sestavování genomu a přerušení sekvence dané úseky se musely naklonovat znova ve větších fragmentech tak aby bylo možno sestavit kontigy (10kb) 21
REPETITIVNÍ SEKVENCE EUKARYOTICKÉHO GENOMU REPETITIVNÍ SEKVENCE EUKARYOTICKÉHO GENOMU Nekódující DNA (90-95%) nachází se mezi geny (extragenová) nebo v genech (intragenová) Single Copy DNA Repetitivní DNA repetitivní geny (histony, rrna, trna) jedinečná Mírně repetitivní 10 1-10 5 kopií 30 % celkové jaderné DNA Vysoce repetitivní (tandemová) >10 5 kopií SINEs Short interspersed elements. např. lidské ALU GC-rich segmenty 300 bp 10 5-10 6 bp LINEs Long interspersed elements. např. lidské Kpn segmenty AT-rich 1.5-6 kb 10 4-10 6 bp Satelitní DNA Minisatelity Mikrosatelity dlouhé repetice 15bp repetice 2-6 bp repetice kolem náhodně centromer a roztroušené telomer VNTRs Variable number Tandem Repeats náhodně roztroušené a variabilní v počtu opakování v rámci populace 22
PARAZITICKÁ DNA PROJEKT SEKVENACE LIDSKÉHO GENOMU Dva hlavní projekty: Human Genome Project (HGP) mezinárodní konsorcium placeno z veřejných peněz Francis Collins, National Human Genome Res. Inst. (NHGRI) začalo fungovat 1990 v USA sekvenování pomocí genomových map Celera Genomics Corporation (CRA) soukromá firma J. Craig Venter, založeno 1998 shotgun sekvencování Obě skupiny vycházely ze vzorku DNA izolované z krve a spermatu anonymních dárců mužského i ženského pohlaví různých etnik 23
PROJEKT SEKVENACE LIDSKÉHO GENOMU 16 únor 2001: první kompaktní výsledky publikováné současně v Nature & Science. HGP: ~22.1 miliard odsekvenovaných nukleotidů 7x překryv CELERA: ~14.5 miliard odsekvenovaných nukleotidů 4.6x překryv 26.4 millionů 550 bp sekvenačních reakcí POKRYTO >99% genomu 20,000 CPU hodin (833 CPU dnů) na superpočítači PROJEKT SEKVENACE LIDSKÉHO GENOMU Identifikace genů v DNA sekvenci: ANOTACE GENU identifikace a popis pravděpodobného genu a předpovězeni jeho funkce počítačový algoritmus pro všechny ORF open reading frame ORF potenciální kódující sekvence pro protein začínající start kodónem a končící stop kodónem ne všechny ORFs kódují proteiny (6-7% nekódují u kvasinek) minimální délka ORF (100bp) velmi složitý algoritmus pro ORF s introny y( (eukaryota) hledání homologie v databázích předpovědění funkce a evolučních vztahu 24
Solitární gen: v celém genomu v jediné kopii (asi polovina genů) Genová rodina: skupina genů evolučně pocházející z jediného genu, v evoluci postupná diverzifikace sekvence a funkce Pseudogen: gen který zmutoval natolik že nemůže být přepisován (v celém genomu > 20 000) Zpracovaný ( processed ) pseudogen: pseudogen vzniklý zpětným přepisem mrna a integrací do genomu 25
PG3 PROJEKT SEKVENACE LIDSKÉHO GENOMU CELKOVÁ VELIKOST ±3.200.000.000 bp (haploidní stav) méně genů než se očekávalo: 30-40,000 (2001) předpovídalo se 150,000 (před sekvenací) poslední odhady 20.500 (2007) méně než Arabidopsis (25.478), červi (19.500) mezidruhové odlišnosti druhu Homo sapiens v rámci celého genomu kolem 0.1% (většina je v nekódujících sekvencích) 99% homologie s ostatními primáty (v genech), 96% (celkem) 1.5% z celkové sekvence genomu kóduje proteiny, 28% je však transkribováno do mrna geny se nacházejí obecně v GC-bohatých regionech parazitická DNA tvoří 45% genomu. Tyto transpozomální elementy však už většinou nejsou aktivní (stále jsou ale aktivní u myši) 223 genů je z bakterií získaných paraziticky (nebyly nalezeny v kvasinkách ani octomilce) KOMPARATIVNÍ GENOMIKA: sleduje konzervativní sekvence mezi různými organismy pomáhá rozpoznat důležité regulační regiony. myš a člověk mají téměř totožné geny rozdíly pravděpodobně v jejích regulaci a síle exprese homologní úseky jsou na různých chromozomech uplatňuje se ve velké míře alternativní sestřih (jedná mrna produkuje různé proteiny) ostrovy genetické stability 26
Snímek 51 PG3 2005 Arabidopsis 25478 genů 2007 human 20500 galuszka; 10/03/2008
ZAJÍMAVOSTI PG5 Chromozom 1 nese nejvíc genů (2968), a nejméně mužský Y chromozom 231 (78 krátké raménko). bylo objeveno kolem 3 miliónu míst kde dochází k mutacím (SNP single nucleotide polymorfism) příslib pro léčbu geneticky podmíněných chorob největší rozdíly jsou v genech spojených se sluchem a čichem v oblasti genomu kde jsou obsaženy geny spojeny s čichem, bylo nalezeno nejvíce mutací 50 genů šimpanzům chybí PG6 OSTATNÍ ODSEKVENOVANÉ GENOMY 27
Snímek 53 PG5 stejná velikost fůze jednoho chromosomu galuszka; 11/03/2008 Snímek 54 PG6 fugu - nejmensi genom obratlovce galuszka; 11/03/2008
OSTATNÍ ODSEKVENOVANÉ GENOMY první odsekvenovaný genom žijícího organismu Haemophilus influenzae 1995 baktérie způsobující zánět mozkových blan u dětí organismus Velikost (Mbp) počet genů člověk (Homo sapiens) lidská mitochondriální DNA 3.200 0.016 20-25.000 32 laboratorní myš (M. musculus) 2.600 ± 25.000 rýže (Oryza sativa) 430 ± 60.000 huseníček (A. thaliana) 125 25.498 kukuřice (Zea mays) 2.500 ± 40-60.000 pšenice (Triticum aestivum) 15.000 ± 40-60.000 hlíst (C. elegans) 97 ± 19.000 octomilka (D. melanogaster) 137 13.472 kvasinka (S. cerevisiae) 12.1 5.770 bakterie (E. coli) 4.6 4.377 virus (HIV) 0.009 9 rok 2001 1981 2002 2003 2001 2009??? 1998 2000 1996 1996 1996 kvasinka člověk organismus s největším známým genomem: Psilotum nudum 250.000 Mbp další: česnek, ropucha, borovice, bahník PRUTOVKA HOLÁ (Psilotum nudum) rostlina, která "zapomněla" vymřít Existují pouze dva druhy prutovek. Mají pro botaniku zvláštní význam z hlediska evoluce rostlin. Velmi se podobají zcela vymřelým psilofytům, výtrusným rostlinám známým jen ze silurských až devonských zkamenělin, starých přes 300 milionů let. Psilofyty stály na samém počátku vývoje všech vyšších neboli cévnatých rostlin, jež potom úplně okupovaly zprvu pusté pevniny naší planety. Roste na Havaji. 28
VÝZNAM SEKVENACE GENOMU počet genů, přesná poloha a funkce regulace genů struktura chromozomů a jeho organizace funkce nekodující sekvence, typy, množství a distribuce koordinace genové exprese a postranslační úpravy PROTEOMIKA interakce protein protein předpovězená vs. experimentálně ověřená funkce evolučně konzervativní vztahy mezi organismy MEDICÍNA korelace (SingleNucleotidePolymorfism) l l s nemocemi předpovídání náchylnosti k nemocem na základě sekvenční variability (identifikace regionů DNA spojených s multigenovými nemocemi) navrhování léčiv na základě molekulární informace navrhování léčiv na míru na základě individuální genetického profilu (farmakogenomika) PG4 HapMap mezinárodní program mapující lidskou druhovou variabilitu konsorcium vědců ze 6 států od roku 2002 se sestavují mapy vzorců SNP vyskytující v rámci populací jednotlivých ras v Africe, Asii a Spojených státech cílem je dramaticky snížit celkový počet nalezených SNP (3.000.000) selektování těch, které souvisejí s geneticky podmíněnými nemocemi 29
Snímek 58 PG4 The DNA samples for the HapMap have come from a total of 270 people. The Yoruba people of Ibadan, Nigeria, provided 30 sets of samples from two parents and an adult child (each such set is called a trio). In Japan, 45 unrelated individuals from the Tokyo area provided samples. In China, 45 unrelated individuals from Beijing provided samples. Thirty U.S. trios provided samples, which were collected in 1980 from U.S. residents with northern and western European ancestry by the Centre d'etude du Polymorphisme Humain (CEPH). galuszka; 10/03/2008
Pyrosekvencování DNA polymerasa dntp mix ATP sulfurylasa Adenosine 5 fosfosulfát Luciferasa Luciferin Apyrasa http://www.youtube.com/watch?v=nffgwgfe0aa I. Izolace genomové DNA a restrikce na vhodné fragmenty (300-800 bp II. III. IV. Zatupení konců a navázání adaptorové sekvence s biotinovou značkou (modrá) a druhé bez (červená) Navázání na kuličky se streptavidinem Nanesení na mikroreaktorovou destičku V. Provedení emulsního PCR (červený a modrý primer) VI. Paralelní pyrosekvencování ve všech jamkách 30
Roche 454/GS FLX Sequencing Technology 1. Illumina/Solexa 2. metoda cyklické reverzibilní terminace 3. 4. 5. 6. 31
Bridge PCR cyklická reverzibilní terminace Chemické štěpení ve vodném prostředí za katalýzy paladiem DEALLYLACE 32
Illumina/Solexa - vyhodnocení SROVNÁNÍ platforma ROCHE 454 ILLUMINA SOLEXA Příprava templátu Fragmentace + emulsní PCR Fragmentace + bridge PCR chemismus Délka jednoho čtení (bp) Doba běhu pyrosekvencování 330 8 hod. Cyklická reverzibilní terminace Přečtené Gb na jeden běh Cena přístroje (USD) Cena přečtení lidského genomu 0.45 500.000 1.000.000 35 9 dní 35 540.000 200.000 ROCHE 454 + dlouhé běhy, lze dělat i de novo nekomplikované genomy (mikroorganismy) + rychlé -- chyby v homopolymerních repeticích (AAAAAAAAA, GGGGGGGGGGG) ILLUMINA/ SOLEXA + nejpoužívanější + obrovský rozsah, resekvenace celého genomu v jednom běhu -- nízká multiplexita 33
Pyrosekvencování a technologie Roche 454 umožnili rozvoj metagenomiky: Rychlé a levné sekvencování genomů jednotlivců Nelze sekvencovat neznáme genomy, kvůli obtížnosti přiřazení (repetice) pouze ty u kterých je znám homologický genom (stejného biologického druhu) Metagenomika studium biologické rozmanitosti a genetického materiálu celé komunity (mikro)organismů přímo v jejich přirozeném prostředí bez nutnosti jejich kultivace v laboratoři (např. z půdy, střevní mikroflora) Metagenom celková genetická informace komunity organismů X Genom celková genetická informace jednoho organismu Střevní mikroflóra P. J. Turnbaugh et al. (2006) An obesity-associated gut microbiome with increased capacity for energy harvest. Nature. Dec 21;444(7122):1027-31. Apendikální mikrobiální DNA z ob/ob, ob/+, +/+ myši Složení mikroflóry střeva závislé na obezitě změny v zastoupení bakteriálních kmenů Bacteroidetes a Firmicutes změny v metabolickém potenciálu střeva (ukládání energie) 34
DNA mamuta - Mammoth Project Hendrik N. Poinar et al (2006): Metagenomics to Paleogenomics: Large-Scale Sequencing of Mammoth DNA. Science Jan. 20, 311 (5759): 392-394. 394 DNA extrahována z 1 g mamutí kosti (28000 let, Siberia) 100 ml DNA fragmenty 500 700 bp 454 sekvenování 28 miliónů bp 302 692 čteníí 45,4% čtení se přirovnalo se sekvencí slona afrického, 1,4% - s lidskou a 1,2% se psí sekvencí. největší význam DIAGNOSTIKA zlevnit přesekvencování lidského genomu na 1.000 USD (do roku 2015) (nové levnější přístupy: SOLID Applied Biosystems, HELIOS) CANCER GENOME ATLAS TRANSCRIPTOME SEQUENCING (RNA-seq) výhoda oproti DNA čipům je že 100% postihuje alternativní sestřih a alelickou variabilitu SINGLE MOLECULE SEQUENCING (Helios) preinplantační diagnostika SOLID PHASE CAPTURE NimbleGene čip vyrobený pro vychytání kodujících sekvencí a regulačních oblastí z rozfragmentované genomické DNA před vlastním vysokoúčinným sekvencováním 35
největší význam DIAGNOSTIKA zlevnit přesekvencování lidského genomu na 1.000 USD (do roku 2015) (nové levnější přístupy: SOLID Applied Biosystem, HELIOS) CANCER GENOME ATLAS TRANSCRIPTOME SEQUENCING (RNA-seq) výhoda oproti DNA čipům je že 100% postihuje alternativní sestřih a alelickou variabilitu SINGLE MOLECULE SEQUENCING (Helios) preinplantační diagnostika SOLID PHASE CAPTURE NimbleGene čip vyrobený pro vychytání kodujících sekvencí a regulačních oblastí z rozfragmentované genomické DNA před vlastním vysokoúčinným sekvencováním DIAGNOSTIKA ChIP-seq (chromatin imuno precipitation) Methyl-seq detekce CpG oblastí (epigenetika) využívá konverze cytidinu na uridin za pomocí bisulfidu methylovaný cytidin není konvertován 36
cdna a GENOMOVÉ KNIHOVNY je to soubor náhodně klonovaných fragmentů genomové DNA nebo cdna, připravené zpětnou transkripci mrna, příslušného organismu do vhodného vektoru, ve kterém může být tento soubor DNA klonů uchováván a množen cdna a GENOMOVÉ KNIHOVNY slouží především ke hledání nových genů a jejích klonování pro další funkční analýzu knihovny lze sestrojit pro všechny živé organismy, pro vědecky významné existuji komerčně dostupné knihovny genomová knihovna obsahuje veškerou informaci obsaženou v genomu (geny a nekódující sekvence) cdna knihovna obsahuje pouze geny exprimované v určitém stádiu vývoje organismu popř. ve specifické tkáni či pletivu jako klonovací vektory pro konstrukci knihoven se používají především vektory odvozené od bakteriofága λ, fazmidy, kosmidy nebo YAC a BAC 37
genomové knihovny lambda FIX II (Stratagene) XhoI Sau3A I 4-místné GATC substituční vektor Spi + selekce klonované fragmenty 9-23kb částečné štěpení RE zaručuje překryvy (kontigy) genomové knihovny lambda FIX II Avian Baboon Bacterial Bovine Canine Cephalopod Chicken Drosophila Feline Fungus Gorilla Guinea Pig Hamster Horse Human Lobster Marsupial Monkey Mouse Nematode Plant Porcine Rabbit Rat Salamander Xenopus Yeast Zebrafish Product: Horse Genomic, Leukocytes Library Arabian, adult stallion, heterozygous for immunodeficiency, Vector: Lambda FIX II vector, Insert Size: 9-23 kb Arabidopsis thaliana Nicotiana Plumbaginifolia barley corn pea soybean Xenopus (drápatka) zebrafish (první transgenní ryba) 38
cdna knihovny lambda ZAP II Linker-primer 5' - CTCGAGTTTTTTTTTTTTTTTTTT 3' - AAAAAAAAAAAAA - 5' mrna Reverse transcriptase, nucleotides XhoI site 5' - CTCGAGTTTTTTTTTTTTTTTTTT 3' - AAAAAAAAAAAAA -3' cdna - 5' mrna RNase, DNA Polymerase, nucleotides XhoI site 5' - CTCGAGTTTTTTTTTTTTTTTTTT 3' - GAGCTCAAAAAAAAAAAAAA - 3' cdna - 5' cdna Add EcoRI adaptors, T4 DNA ligase EcoRI XhoI EcoRI 5' - AATTC...CTCGAGTTTTTTTTTTTTTTT...G - 3' 3' - G...GAGCTCAAAAAAAAAAAA...CTTAA - 5' Digest with XhoI XhoI 5' - TCGAGTTTTTTTTTTTTTTT 3' - CAAAAAAAAAAAA Clone into cdna vector with 5' EcoRI and 3' XhoI EcoRI...G - 3'...CTTAA - 5' inzerční vektor fazmid blue/white screening klonované fragmenty 0-10kb cdna knihovny lambda ZAP II Výhody: vysoká efektivnost fágové infekce plazmid (pblueskript) se vyštěpuje z fazmidu (s plazmidem se lépe manipuluje a sekvencuje) zvýšené zastoupení málo abundantních transkriptů: pomocí metody SSH (supressive and subtractive hybridization) se sníží množství vysoce abundantních transkriptů (např. transkripty Rubisco tvoří často 10% z celkové rostlinné cdna) pomocný fág (má mutaci tak, že se sám nereplikuje ale po koinfekci s fazmidem mu umožní vytvořit infekční částice, tím že vytvoří sbalovací proteiny, jejichž genetická informace na klonovaném fazmidu chybí. Navíc nese aparát pro tvorbu ssdna. 39
supressive and subtractive hybridization (SSH) studovaná RNA srovnávací RNA studovaná RNA raritní molekuly zůstávají více nehybridizované hybridizace kinetika druhého řádu, abundantní molekuly hybridizují velice rychle spolu další využití: zjišťování nebezpečných genů u patogenních organismů 40
EST klony (Expressed Sequence Tags) Co to je EST? krátká DNA sekvence (okolo 300-1000 bp) odvozená z cdna reprezentuje geny exprimované ve tkáních ze kterých je odvozena cdna knihovna - TRANSCRIPTOM pletivově specifické cdna knihovny listy, kořeny, semena, plody, pyl, květy.. specifické cdna knihovny po infekci patogenem, po působení hormonů, stresu atd. Výhody EST sekvenci zdroj informaci o genech exprimovaných ve specifických tkáních, nebo v závislosti na odpovědi vůči vnějším vlivům základní srovnávání mezi různými organismy základ pro rozlišování genových rodin a identifikace alelických variací popř. alternativniho sestřihu Nedostatky EST klonů cdna neobsahuje regulační oblasti a celé kompaktní geny často jenom 3 a 5 konce cdna klonů (500-700 bp, jedna sekvenační reakce) syrová data, chyby 41
hledání genů in silico v internetových databazích TIGR a GeneBank hledání genů in silico v internetových databazích TIGR a GeneBank Výsledky hledání v GenBank... 42
výsledek hledání pro polygalakturonasu z rajčete počty EST klonů v databázích k roku 2003 Člověk přes pět miliónů EST klonů cdna knihovny lambda ZAP II Algae Baboon Bovine Canine Chicken Feline Fish Fungus Hamster Human Fetal Human Human Neuron and Teratocarcinoma Insect Lobster Marsupial Monkey Mouse Nematode Plant Porcine Rabbit Rat Salamander Sheep Xenopus Human cdna, Aortic Smooth Muscle Cell Library Human cdna, Brain (Cerebellum) Library Human cdna, Brain (Frontal cortex) Library Human cdna, Breast Carcinoma Library Human cdna, Erythroleukemia cell Library Human cdna, Heart Library Human cdna, Kidney Library Human cdna, Uterus Library (8 pooled normal whole specimens, Caucasian, 21-60 years, Vector: Uni-ZAP XR vector, Primer: UdT, Average Insert Size: 1.3 kb) atd. celkem 57 Plant cdna, Arabidopsis thaliana Library Plant cdna, Barley Library Plant cdna, Soybean Library Plant cdna, Tobacco Leaf Library Plant cdna, Tomato Library Plant cdna, Spinach Library (var. Melody, actively growing leaves, Primer: OR, Vector: Lambda ZAP II vector, Average Insert Size: 1.0 kb) 43
SCREENING cdna a GENOMOVÝCH KNIHOVEN otisk plaků na nitrocelulosovou membránu denaturace DNA na filtru inkubace s hybridizační sondou vyvolání otisku detekce plaku obsahují požadovaný gen vyříznutí a namnožení požadovaného klonu SCREENING BACových knihoven pomocí poolování 44
cdna a GENOMOVÉ KNIHOVNY VELIKOST KNIHOVNY vyjadřuje kolik rekombinatních fágu (plaků) musíme screenovat abychom prošli celý genom nebo cdna pool. P.pravděpodobnost, že je klon zastoupen n.poměr průměrné velikosti klonovaného inzertu k velikosti genomu např. při screeningu lidského genomu o velikosti 3.200 Mbp který je v λ genomové knihovně s velikosti fragmentů 20 kbp musíme na Petriho miskách vypěstovat pro následnou analýzu alespoň 6.5 x 10 5 plaků abychom s 99% pravděpodobnosti zaručili, že je analyzován celý genom cdna a GENOMOVÉ KNIHOVNY DALŠÍ TYPY KNIHOVEN: EXPRESNÍ GENOMOVÁ KNIHOVNA vychází z cdna knihovny, která je ale umístěna v expresních vektorech (klonovací vektory, které navíc transgen v nich obsažený exprimují do proteinu) Používají se pro hledaní genů pokud známe pouze protein, který kódují (pomocí protilátky) CHROMOZOMOVÉ KNIHOVNY obsahují informaci pouze z jednoho chromozomu (jsou menší) HYBRIDNÍ KNIHOVNY systém pro studium interakce protein -protein, bait vektor (návnada) obsahuje gen pro protein, který studujeme a fish (prey) vektor (obsahuje danou cdna expresní knihovnu) s pomocí genomových knihoven se uskutečnila sekvenace celých genomů několika organizmů. díky tomu ale genomové knihovny vsoučasné době ztrácejí na významu (veškerá genetická informace je obsažena in silico a pomocí vhodných primerů si lze kdykoli daný úsek naamplifikovat 45
YEAST TWO HYBRID SYSTÉM PRO STUDIUM PROTEIN-PROTEIN INTERAKCÍ význam pro studium regulačních a signálních drah naklonovaná cdna knihovna z libovolného euk.organismu konstitutivní promotor kvasinkový chromozom 46