6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života? Pamatujete na to, co se objevilo v pracích Charlese Darwina a Alfreda Wallace ohledně vývoje druhů? Aby mohl mechanismus přírodního výběru fungovat, je třeba, aby v přírodě existovala variabilita, různorodost mezi jedinci, aby měl přírodní výběr z čeho vybírat. Různorodost vlastností je dána různorodostí genetické informace (samozřejmě vnější podmínky mohou tuto různorodost dále zvyšovat). Zdrojem této variability v DNA, jak jsme se již dozvěděli dříve, jsou mutace, které pozměňují DNA a tvoří tak nové varianty. Takto vzniklá variabilita je pak dále promíchávána procesem pohlavního rozmnožování (rekombinace DNA + spojení dvou genomů) a/nebo horizontálním přenosem genů. Tato přednáška se věnuje právě variabilitě DNA. K čemu se může hodit znalost variability na úrovni DNA? Například pomocí ní můžeme zpětné vystopovat molekulární evoluci a poskládat tak vývojový strom života, přesněji určit příbuzenské vztahy mezi druhy nebo rozlišit druhy/kmeny jiným způsobem nerozlišitelné. Můžeme zjistit stupeň biodiverzity - horké ekologické téma. Je možné se ptát, který gen a jaká jeho forma vede k určité vlastnosti (například predispozice k nemocím, výnos obilí apod.). A nebo také můžeme určovat příbuznost jedinců (otcovství) nebo identifikovat pachatele. Kde v DNA nalézáme variabilitu a jaký význam má? Když srovnáme dvě DNA, můžeme nalézt nejrůznější rozdíly, záleží na tom, jaké DNA srovnáváme a co hledáme. Podívejme se nejdříve na to z hlediska realizace dědičné informace, tj. jakým způsobem může mutace ovlivnit realizaci genetické informace. Z hlediska genu záleží na tom, kde se nalézá záměna, kde se objevila mutace. Mutace může být v regulační oblasti genu, což se může projevit změnou aktivity genu, tj. kdy, kde nebo jak moc se produkuje protein, který je tímto genem kódován. Tyto změny jsou například nesmírně důležité z hlediska vývojové biologie (více v dalších přednáškách). Přímo na fungování proteinu budou mít vliv mutace, které se objeví v kódující sekvenci, tj. zasáhnou jednotlivé kodóny. Protože je genetický kód degenerovaný (je více možností kodónů pro jednu aminokyselinu), je možné, že změna jednoho nukleotidu se neprojeví změnou aminokyseliny (tichá mutace). Taková změna v DNA zpravidla nemá žádný dopad a proto se jedná většinou o polymorfismus. Pokud změna nukleotidu v kódující sekvenci zároveň změní smysl kodónu, tj. ve výsledném proteinu bude zařazena jiná aminokyselina, bude záležet na tom, jaký dopad taková změna má. Pokud bude aminokyselina zaměněna jinou s podobnými vlastnostmi, nemusí to mít nijak závažný dopad na fungování proteinu. I v takovýchto případech se často jedná o polymorfismus bez nějakého velkého funkčního efektu. Pokud ovšem dojde k radikální změně (aminokyselina s úplně jinými vlastnostmi), může to pozměnit výrazně fungování proteinu nebo takový protein nemusí fungovat vůbec. Taková mutace buď bude z populace vyřazena (poškozuje nositele) nebo se může stát objektem přírodního výběru v pozitivním smyslu a ovlivní evoluci (může se třeba stát důležitým krokem v procesu speciace). Kodóny jsou tvořeny třemi nukleotidy a pokud dojde k vmezeření nebo k odstranění jedné či dvou bazí, posune se celý čtecí rámec (tzv. frameshift mutace), což znamená změnu celé proteinové sekvence za tímto bodem - ve většině případů je takový protein nefunkční. Tyto příklady se týkaly přímo kódující sekvence. Ta je u většiny složitějších organismů přerušena introny. Protože jsou introny vyštěpovány pryč, změna jejich sekvence nemá ve většině případů příliš zásadní dopad, může se ovšem stát, že zasáhne místo v intronu, důležité pro správný sestřih pre-mrna a pak může proces sestřihu ovlivnit. To se může projevit nesprávným vystřižením intronu - poškozující mutace, nebo může vést k nové variantě při alternativním sestřihu a poskládání nové varianty výsledného proteinu. Nebo se mutace/záměna objeví mimo genovou oblast a pak nemusí mít žádný funkční význam (zpravidla opět polymorfismus), ale i mezigenové oblasti mohou být důležité, například pro strukturu a chování chromozomu apod.
Jak detekovat variabilitu v DNA? Možností je opět mnoho a cílem není je všechny představit. Podívejme se tedy na nějaké konkrétní příklady, jak variabilitu v DNA zjistit a co nám to může říci. Například pro molekulární fylogenetiku se často využívá genový lokus pro ribozomální RNA (rrna), který nekóduje protein, ale pouze RNA (centrální dogma se zastaví na úrovni RNA), která je součástí ribozómů (ty se skládají u všech organismů z proteinů a RNA molekul). Struktura ribozómů je nesmírně důležitá pro veškeré živé organismy a proto si je evoluce "nedovolí" příliš měnit - geny pro ribozomální RNA jsou tudíž velmi podobné u všech organismů. Eukaryotická rrna se přepisuje jako jedna delší RNA, která v sobě obsahuje úseky pro 3 molekuly rrna - 18S rrna, 5.8S rrna a 28S rrna, které jsou odděleny sekvencemi ITS-1 a ITS-2 (internal transcribed spacer). ITS se vyštěpí a na ribozom se použijí pouze ty tři rrna. Ty jsou evolučně velmi konzervované, čili se v nich najde jen minimálně záměn i při srovnání sekvencí dvou vzdálených druhů. To umožňuje navrhnout primery do těchto sekvencí, které budou fungovat pro spoustu různých druhů. Pomocí těchto primerů je možné namnožit metodou PCR sekvenci těchto ribozomálních genů a srovnávat ji mezi blízce nebo vzdáleně příbuznými druhy. Protože ITS sekvence nejsou důležité pro strukturu ribozómů (jsou z rrna vyštěpeny), hromadí se v nich během evoluce změny. Takže při srovnání i velmi blízce si příbuzných druhů v nich změny najdeme, ale přilehlé sekvence konzervovaných rrna nám umožní jednou sadou primerů namnožit tyto sekvence z různých druhů. Porovnáním různých sekvencí ITS (vytvořením tzv. alignmentu - srovnání sekvencí pod sebe na základě jejich podobnosti) můžeme spočítat počet rozdílů mezi nimi a na základě toho vytvořit vývojový strom - jak moc si jsou druhy příbuzné a jak se postupně během evoluce odštěpovaly. To samé můžeme udělat i
porovnáním sekvencí jednotlivých rrna, ale tam najdeme rozdíly pouze u evolučně vzdálenějších druhů, proto nám to umožňuje tvořit rozsáhlejší evoluční stromy, pro blízce příbuzné druhy se tato analýza nehodí. Příklad srovnání sekvencí pod sebe na základě jejich podobnosti (stejné nukleotidy jako v horní sekvenci jsou nahrazeny pomlčkou, pouze nukleotidy, ve kterých se sekvence liší od té horní, tzv. referenční sekvence, jsou zobrazeny). Tento tzv. alignment, vytváří speciální počítačové programy, patřící mezi bioinformatické nástroje:
Srovnání rrna a vmezeřené ITS sekvence nám tedy umožňuje analyzovat variabilitu mezi vzdáleně a blízce příbuznými druhy. Ale jak analyzovat variabilitu mezi jedinci jednoho druhu, kteří mají DNA příliš podobnou? Například DNA dvou lidí se liší pouze asi 0,1%, tj. na každých 1000 nukleotidů lidské DNA najdeme průměrně 1 nukleotid, ve kterém se dva jedinci budou lišit. A v každém případě se nebudou lišit v sekvenci rrna. Naštěstí se různě po genomu vyskytují tzv. mikrosatelity, což jsou sekvence DNA, ve kterých se opakuje jeden, dva, tři nebo i čtyři nukleotidy dokola, třeba 20x, jako v této dvounukleotidové repetici: CACACACACACACACACACACACACACACACACACACACA Takovýchto mikrosatelitů je po genomech nejrůznějších organismů mnoho. A protože DNA polymeráza při kopírování DNA snadno v takové sekvencii uklouzne (DNA polymerase slippage): dochází relativně často k přidání (jako na obrázku a) nebo ubrání (jako na obrázku b) jednotky (např. CA). Proto se velmi často jedinci jednoho druhu liší v počtu jednotek v jednotlivých mikrosatelitních sekvencí.
Toho se dá využít pro detekci variability v rámci populace jednoho druhu, nebo k identifikaci konkrétního jedince (při srovnání více mikrosatelitních lokusů - kriminalisté např. srovnávají sekvence 13 různých mikrosatelitů, protože je prakticky nemožné, aby se dva lidi na této planetě shodovali v počtu opakování jednotek všech 13 lokusů - až na jednovaječná dvojčata, samozřejmě). Shrneme-li si tedy možnosti detekce variability, vyjde nám, že nejdříve namnožíme konkrétní úsek DNA, kde variabilitu očekáváme, pomocí PCR a pak buď detekujeme bodové mutace pomocí sekvenování, nebo určíme rozdíly v počtu opakovaných jednotek mikrosatelitů pomocí elektroforézy:
A podle toho, co chceme mezi sebou porovnávat, využijeme více polymorfní lokusy (mikrosatelity, nebo ITS) nebo naopak velmi konzervované geny: Výše uvedené příklady slouží k tvorbě fylogenetických stromů, určování příbuznosti organismů, případně analýze biodiverzity. Jsou založeny na analýze několika vybraných sekvencí DNA, které vykazují potřebnou variabilitu. Ovšem vraťme se k původní otázce přírodního výběru, který potřebuje genetickou variabilitu, aby měl z čeho vybírat. Najít polymorfismy v DNA, které jsou zodpovědné za různorodost v určitých vlastnostech, a které jsou tím pádem objektem přírodního výběru, není rozhodně jednoduchá záležitost. Obrázek níže například zobrazuje kus genetické informace člověka, přičemž oranžovou barvou je zvýrazněna kódující sekvence, ostatní jsou sekvence intronů. Zeleně jsou zvýrazněny pozice, ve kterých se DNA různých lidí liší - zobrazená sekvence představuje její jednu konkrétní podobu, DNA jiného člověka by se v některých těchto
pozicích lišila (vykazovala by některé jiné zelené nukleotidy - tzv. jednonukleotidové polymorfismy neboli SNP - Single Nucleotide Polymorhism): A je otázkou, které z těchto SNP mají nějaký funkční význam, které z nich ovlivňují vlastnosti organismu takovým způsobem, že by se mohly stát objektem přírodního výběru. Pravděpodobně mnoho těch, které jsou mimo kódující oblast nebude mít zásadní dopad, ale možná některé z těch, které se nachází v kódující sekvenci (oranžově na obrázku) mohou měnit smysl kodónu a tak aminokyselinu ve vznikajícím proteinu (viz. mutace výše), což může ve svém důsledku ovlivnit to, jakým způsobem protein funguje a celkově vlastnost, na které se fungování proteinu podílí. Ovšem zjistit tento funkční vztah mezi nějakým SNP a určitou vlastností je velice obtížné. Nové metody sekvenování genomů a genomické přístupy ovšem mohou v tomto přinést v blízké budoucnosti velké pokroky. Například čipy firmy Illumina dokážou najednou analyzovat milióny polymorfismů ve vzorku lidské DNA a porovnávat tak DNA různých jedinců s různými vlastnostmi. Pokud bude porovnáno dostatečné množství jedinců s určitou vlastností, bude možné s určitou pravděpodobností určit, které SNP se častěji vyskytují u jedinců s touto vlastností. Tak možná budeme časem schopni určit, které nukleotidy nás geneticky předurčují k určitým schopnostem, talentu, nebo nás činí náchylnějšími k některým nemocem.