PA054: Formální modely v systémové biologii David Šafránek 2.5.2012
Obsah Algebraický přístup k modelování biochemických reakcí
Princip modelování Substráty molekuly populace interagujících molekul každou molekulu (proteinu) lze popsat stavově stav zachycuje konfiguraci vazebných míst volná vazebná místa vazebná místa obsazena jinou molekulou (dimerizující stavy) formalizace prostřednictvím sekvenčního procesu: MEK MEKp MEKpp
Princip modelování Substráty molekuly populace interagujících molekul každou molekulu (proteinu) lze popsat stavově stav zachycuje konfiguraci vazebných míst volná vazebná místa vazebná místa obsazena jinou molekulou (dimerizující stavy) formalizace prostřednictvím sekvenčního procesu:?p1 MEK?d1?p2 MEKp?d2 MEKpp
Princip modelování Substráty molekuly populace interagujících molekul každou molekulu (proteinu) lze popsat stavově stav zachycuje konfiguraci vazebných míst volná vazebná místa vazebná místa obsazena jinou molekulou (dimerizující stavy) formalizace prostřednictvím sekvenčního procesu: requires phosporylating enzyme?p1 MEKp?d1 MEK?p2?d2 MEKpp requires dephosporylating enzyme
Princip modelování Interakce proce procmek procpp Ef MEK?p1!p1?d1!d1?p2 Eb MEKp MEKpp?d2 PPf PPb paralelní chování procesů (molekul) binární synchronizace roztok lze modelovat jako populaci procesů: proc MEK proc MEK proc E proc E proc E proc PP proc PP
Princip modelování Interakce proce procmek procpp Ef MEK?p1!p1?d1!d1?p2 Eb MEKp MEKpp?d2 PPf PPb paralelní chování procesů (molekul) binární synchronizace roztok lze modelovat jako populaci procesů: proc MEK proc MEK proc E proc E proc E proc PP proc PP
Molekuly jako komunikující automaty individuální přechody a synchronizace lze modelovat stochasticky (provedení přechodu v čase t Exp(r i ))
Molekuly jako komunikující automaty
Elementární reakce jako komunikující automaty
Elementární kalkulus pro popis (bio)chemických systémů Syntax Andrew Phillips, Luca Cardelli, and Giuseppe Castagna, A Graphical Representation for Biological Processes in the Stochastic Pi-calculus, in Transactions in Computational Systems Biology, vol. 4230, pp. 123 152, Springer, November 2006
Příklad
Elementární kalkulus pro popis (bio)chemických systémů Sémantika!x.P + M!x P?x.P + M?x P τ r.p r P P!x P Q?x Q P Q x P Q M α P π.p + M α P P α P Q α P Q X = P P α P X α P SOS pravidla definují fragment stochastického π-kalkulu
Rozšíření o předávání hodnot Syntax Andrew Phillips, Luca Cardelli, and Giuseppe Castagna, A Graphical Representation for Biological Processes in the Stochastic Pi-calculus, in Transactions in Computational Systems Biology, vol. 4230, pp. 123 152, Springer, November 2006
Rozšíření o předávání hodnot Sémantika!x(n).P + M!x(n) P?x(m).P + M?x(m) P {n/m} τ r.p r P P!x(n) P Q?x(n) Q P Q x P Q M α P π.p + M α P P α P Q α P Q X (m) = P α P {n/m} P α X (n) P SOS pravidla definují fragment stochastického π-kalkulu
Příklad modelování genetické regulační sítě Gene(a, b) = τ t.(gene(a, b) Protein(b))+?a.Blocked(a, b) Blocked(a, b) = τ u.gene(a, b) Protein(b) =!b.protein(b) + τ d.0 Ralf Blossey, Luca Cardelli, and Andrew Phillips, A Compositional Approach to the Stochastic Dynamics of Gene Networks, in Transactions in Computational Systems Biology, vol. 3939, no. 3939, pp. 99 122, Springer, January 2006
Příklad modelování genetické regulační sítě Gene(c, a) Gene(a, b) Gene(b, c)
High-level modelování C. elegance
High-level modelování C. elegance: vývoj vulvy
High-level modelování C. elegance: vývoj vulvy
High-level modelování C. elegance: možné varianty signálních drah LIN3... signál od řídící buňky (anchor cell, AC) LIN12... laterální mezibuněčný signál
High-level modelování interagující buňky Vývoj vulvy C. elegans Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
High-level modelování interagující buňky Vývoj vulvy C. elegans x... č. buňky, l, r... kanály laterálního signálu, k... vzdálenost od AC (frekvence interakce s AC) Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
High-level modelování interagující buňky Vývoj vulvy C. elegans Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
High-level modelování interagující buňky Vývoj vulvy C. elegans podrobný model Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
High-level modelování interagující buňky Vývoj vulvy C. elegans podrobný model Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
High-level modelování simulace Vývoj vulvy C. elegans
Kalkuly pro biologické systémy Stochastic π-calculus (SPiM, BioSPI) BioPEPA κ-calculus Brane-Calculus, BetaBinders, BlenX...
BioPEPA na rozdíl od π-based kalkulů je BioPEPA orientovaný bĺıže SBML rozlišení není až na úroveň molekul, ale na úroveň substrátů a reakcí proces není molekula, ale substrát výhodou je kompatibilita sémantik s SBML (srovnej s Petriho sítěmi) možnost plného modelování netriviální kinetiky (např. regulace, enzymová kinetika)
BioPEPA příklad 2S P; E S = (α, 2) S E = (α, 1) E P = (α, 1) P (S(I S0 ) α (E(I E0 )) α P(I P0 )) Sémantika dynamiky je definována pravidlem f α = v E S K+S 2.
BioPEPA syntax Algebra modelových komponent S ::= (α, k) op S S + S C op = P ::= P L P S(I ) L je množina reakcí I je iniciální podmínka
BioPEPA syntax Definice elementárních komponent substráty Každá komponenta C je charakterizována 5-ticí H, N, M 0, M, V, kde: H R + je rozlišení kvantity (velikost jedné úrovně koncentrace), N N je maximální hodnota kvantity, M 0 R + { } je iniciální koncentrace, M R + { } je maximální koncentrace, V označuje kompartment do něhož je komponenta přiřazena. Pozn. (1): značí nedefinovanou hodnotu Pozn. (2): M, M 0 jsou uvedeny pro kalibraci se spojitým modelem.
BioPEPA syntax Definice elementárních komponent substráty diskretizace koncentrace pomocí úrovní stejné délky (v počtu molekul) diskrétní sémantika tedy umožňuje kalibraci se spojitou (aproximace) počet úrovní pro komponentu C i je N i + 1, kde N i je max. úroveň platí: N j = M j H kde M j M, 0 j < N, reprezentuje hraniční koncentraci mezi levely N j, N j+1 pro aktuální úroveň 0 l j N j je koncentrace definována vztahem x j = l j H
BioPEPA definice biologického procesu BioPEPA systém je šestice V, N, K, F R, Comp, P kde: V... množina kompartmentů, N... množina kvantit popisujících substráty, K... množina definic parametrů, F R... množina definic dynamiky, Comp...definice komponent, P... komponenta popisující systém.
BioPEPA sémantika každá akce α má přiřazenu kinetickou funkci f α nad kvantitami substrátů kvantity substrátů jsou určeny z kontextu akce α kinetické funkce mohou obsahovat kinetické parametry, které musí být asociovány v K příklady typů kinetických funkcí: fma(k) = k n j i=1 (C i) κ i kde n j je počet reaktantů reakce α j a κ i je příslušný stechiometrický koeficient reaktantu C i fh(v, K, n) = v C n /(K + C n ) je Hillova kinetika
BioPEPA operační sémantika Předpokládáme C spočetná množina zahrnující všechny možné modelové komponenty. BioPEPA systém má asociovánu stochastickou sémantiku, která je definována prostřednictvím odvozující relace c C Ω C, kde θ Ω vyjadřuje kvantitativní informaci potřebnou k vyhodnocení kinetické funkce, θ := (α, w) kde w := [S : op(l, κ)] w@w, S C, l hodnota kvantity komponenty S, κ stechiometrický koeficient komponenty S v α. Relace c je definována jako minimální relace splňující pravidla na násl. slidu.
BioPEPA odvozující relace
BioPEPA stochastická sémantika Stochastická sémantika BioPEPA systému je určena relací: s P Γ P kde γ Γ, γ := (α, r α ), r α R + určuje parametr exponenciální distribuce události v čase (rate). Relace s je definována pomocí pravidla: kde r α [w, N, K] = f α[w, N, K] H H je velikost kroku f α [w, N, K] značí kin. funkci f α vypočítanou v přísl. kontextu
BioPEPA stochastická sémantika Evaluace f [w, N, K]: pro každou komponentu C i je odvozena koncentrace l i H volný výskyt C i je nahrazen (l i H) κ ij, kde κ ij je stechiometrický koeficient substrátu C i v reakci R j pozn.: pro H = 1 a vhodné omezení kinetických funkcí dostáváme přímou stochastickou sémantiku (relace s definuje CTMC, který bychom získali interpretací stochastické Petriho sítě odpovídající BioPEPA systému)
BioPEPA příklad Uvažujme reakci α : 2X + Y k 3Z. Kinetika je definována funkcí v = k X 2 Y. Definujeme komponenty BioPEPA: Reakční systém je definován: X (l X0 ) {α} Y (l Y0 ) {α} Z(l Z0 ) kde l X0, l Y0, l Z0 značí iniciální úrovně koncentrace, kin. funkce je definována f α = fma(k). Pro reakci bude odvozením stochastické sémantiky vypočítán rate r α = k (l X H) 2 (l Y H) H Reakce bude provedena pouze v situaci: N X je nejméně 3, N Z je nejméně 4.
κ-calculus Laneve, C. and Tarissan, F. 2007. A Simple Calculus for Proteins and Cells. Electron. Notes Theor. Comput. Sci. 171, 2 (Jul. 2007), 139-154.
κ-calculus vazebná místa 1,2 navázaná vazebná místa 3 skrytá vazebná místa 4 viditelná vazebná místa
κ-calculus interakce proteinů proteiny mohou vytvářet komplexy spojováním na vazebných místech kolekce proteinů a jejich komplexů tvoří roztok (solution)
κ-calculus příklady spojení
κ-calculus komplexace
κ-calculus požadavek monotonicity NEPOVOLENÁ OPERACE, nesplňuje monotonicitu updatu vazeb
κ-calculus syntax spočetná množina jmen proteinů P, zn. A, B,... P spočetná množina jmen hran E, zn. x, y,... E signatura, : P N (A) zn. počet vazeb proteinu A (A, i) značí i-té vazebné místo na A
κ-calculus rozhraní lib. paricální zobrazení N E {h, v} nazýváme rozhraní, zn. ρ, σ,... vazebné místo (A, i) nazýváme: viditelné, pokud ρ(i) = v skryté, pokud ρ(i) = h vázané, pokud ρ(i) E rozhraní reprezentuje stav roztoku
κ-calculus příklad rozhraní Předpokládejme A t.ž. (A) = 3, pak ρ(1) = v, ρ(2) = h, ρ(3) = x je rozhraní proteinu A, v němž místo 1 je viditelné, místo 2 skryté, a místo 3 vázané na jméno hrany x E. Symbolicky píšeme: ρ = 1 + 2 + 3 x
κ-calculus syntax roztoku S := 0 prázdný roztok A(ρ) protein S, S skupina (νx)(s) vazba Pro množinu jmen x 1, x 2,..., x n používáme notaci x a vazbu rozšíříme na (ν x)(s).
κ-calculus syntax roztoku induktivně definujeme množinu volných jmen v roztoku S, zn. fn(s): výskyt x v S je vázaný pokud je zanořen pod operátorem νx roztok S je uzavřený pokud všechny výskyty jmen v S jsou vázané (zejména fn(s = ))
κ-calculus strukturní kongruence Definujeme relaci strukturní kongruence, zn., jako nejmenší ekvivalenci uzavřenou syntakticky asociativní a komutativní operací seskupení,, α-ekvivalencí (injektivní přejmenování vázaných jmen) a 0 chápanou jako neutrální prvek, dále splňující pravidla: 1. (νx)(νy)(s) (νy)(νx)(s), 2. (νx)(s S, pro x fn(s), 3. (νx)(s), S (νx)(s, S ), pro x fn(s ). Přejmenování Přejmenování r je konečná parciální injekce na množině E {h, v}, která je identitou na {h, v} a zobrazuje E E.
κ-calculus propojenost Definujeme propojený roztok strukturní indukcí: A(ρ) je propojený, je-li S propojený, pak i (νx)(s) je propojený, jsou-li S, S propojené a fn(s S ), pak S, S je propojený, je-li S propojený a S T, pak T je propojený.
κ-calculus vizuální omezenost Roztok je vizuálně omezený, pokud: výskyt lib. volného jména v S je max. dvojnásobný vazba (νx)(s) váže buď 0 nebo 2 výskyty x
κ-calculus příklad
κ-calculus příklad
κ-calculus příklad
κ-calculus relace růstu cílem je omezit prostor možných interakcí (reakcí) nástrojem bude monotonost updatů vazeb formálně zachycena relací růstu definovanou na parciálních rozhraních idea: ρ ρ odpovídá situaci ρ obsahuje více vazeb než ρ relace je parametrizována danou množinou jmen x reprezentující právě nové (přidané) hrany
κ-calculus relace růstu
κ-calculus relace růstu relace definována pouze pro rozhraní rozšíříme na skupiny proteinů Definice (Preprotein) Pro libovolný protein A a parciální rozhraní ρ nazveme A(ρ) preproteinem. Definice (Preroztok) Libovolnou skupinu preproteinů nazveme preroztokem.
κ-calculus relace růstu (rozšíření na preroztoky) interpretace x S S : nové vazby přidány (S zahrnuje více spojení) (SYNTH) povoluje vytváření nových proteinů s plnými rozhraními
κ-calculus reakce Nechť S, S jsou preroztoky. monotonní reakce r 1 : S (ν x)s je monotonní reakce pokud: x S S S a (ν x)s jsou vizuálně omezené S je propojený antimonotonní reakce r 2 : (ν x)s S je antimonotonní reakce pokud: reakce S (ν x)s je monotonní.