Řízení rychlosti vozu Formule 1 pomocí rozhodovacího diagramu Jiří Vomlel Ústav teorie informace a automatizace (ÚTIA) Akademie věd České republiky http://www.utia.cz/vomlel Praha, 29. února 2016
Fyzikální model vozu F1 Obsah přednášky
Obsah přednášky Fyzikální model vozu F1 Popis závodního okruhu v Silverstone
Obsah přednášky Fyzikální model vozu F1 Popis závodního okruhu v Silverstone Zadání optimalizační úlohy
Obsah přednášky Fyzikální model vozu F1 Popis závodního okruhu v Silverstone Zadání optimalizační úlohy Očekávaný užitek a jeho maximalizace
Obsah přednášky Fyzikální model vozu F1 Popis závodního okruhu v Silverstone Zadání optimalizační úlohy Očekávaný užitek a jeho maximalizace Rozhodovací diagramy
Obsah přednášky Fyzikální model vozu F1 Popis závodního okruhu v Silverstone Zadání optimalizační úlohy Očekávaný užitek a jeho maximalizace Rozhodovací diagramy Rozhodovací diagram pro optimální rychlostní profilu vozu F1
Obsah přednášky Fyzikální model vozu F1 Popis závodního okruhu v Silverstone Zadání optimalizační úlohy Očekávaný užitek a jeho maximalizace Rozhodovací diagramy Rozhodovací diagram pro optimální rychlostní profilu vozu F1 Jak vypadá řízení v praxi (video jízdy Sebastiana Vettela)
Obsah přednášky Fyzikální model vozu F1 Popis závodního okruhu v Silverstone Zadání optimalizační úlohy Očekávaný užitek a jeho maximalizace Rozhodovací diagramy Rozhodovací diagram pro optimální rychlostní profilu vozu F1 Jak vypadá řízení v praxi (video jízdy Sebastiana Vettela) Porovnání reálných jízd s řešeními získanými pomocí rozhodovacího diagramu
Obsah přednášky Fyzikální model vozu F1 Popis závodního okruhu v Silverstone Zadání optimalizační úlohy Očekávaný užitek a jeho maximalizace Rozhodovací diagramy Rozhodovací diagram pro optimální rychlostní profilu vozu F1 Jak vypadá řízení v praxi (video jízdy Sebastiana Vettela) Porovnání reálných jízd s řešeními získanými pomocí rozhodovacího diagramu Shrnutí
Fyzika závodního vozu F1 Credit: Stuart Taylor, https://sidepodcast.com/
Fyzika závodního vozu F1 i 1 i s i + 1 Vozidlo modelujeme jako hmotný bod.
Fyzika závodního vozu F1 i 1 i s i + 1 Vozidlo modelujeme jako hmotný bod. Hmotný bod se pohybuje po předem zadané dráze.
Fyzika závodního vozu F1 i 1 i s i + 1 Vozidlo modelujeme jako hmotný bod. Hmotný bod se pohybuje po předem zadané dráze. Dráhu rozdělíme na mnoho malých segmentů pevně dané délky s (např. jeden metr).
Fyzika závodního vozu F1 i 1 i s i + 1 Vozidlo modelujeme jako hmotný bod. Hmotný bod se pohybuje po předem zadané dráze. Dráhu rozdělíme na mnoho malých segmentů pevně dané délky s (např. jeden metr). Index i {0,..., n} bude označovat souřadnice bodu dráhy.
Fyzika závodního vozu F1 i 1 i a i s i + 1 v i+1 Vozidlo modelujeme jako hmotný bod. Hmotný bod se pohybuje po předem zadané dráze. Dráhu rozdělíme na mnoho malých segmentů pevně dané délky s (např. jeden metr). Index i {0,..., n} bude označovat souřadnice bodu dráhy. Symbol v i bude značit rychlost v bodě i.
Fyzika závodního vozu F1 i 1 i a i s i + 1 v i+1 Vozidlo modelujeme jako hmotný bod. Hmotný bod se pohybuje po předem zadané dráze. Dráhu rozdělíme na mnoho malých segmentů pevně dané délky s (např. jeden metr). Index i {0,..., n} bude označovat souřadnice bodu dráhy. Symbol v i bude značit rychlost v bodě i. Symbol a i bude značit zrychlení v segmentu [i, i + 1]. Předpokládáme, že zrychlení je v každém segmentu konstantní.
Fyzika závodního vozu F1 Rychlost v i+1 je funkcí rychlosti v i a zrychlení a i : v i+1 = (v i ) 2 + 2 s a i.
Fyzika závodního vozu F1 Rychlost v i+1 je funkcí rychlosti v i a zrychlení a i : v i+1 = (v i ) 2 + 2 s a i. Čas t i+1 potřebný na projetí segmentu [i, i + 1] je: ( ) 2 t i+1 = s. v i + v i+1
Řízení rychlosti vozu F1 Předpokládáme, že řídící proměnná u i je konstantní v segmentu [i, i + 1].
Řízení rychlosti vozu F1 Předpokládáme, že řídící proměnná u i je konstantní v segmentu [i, i + 1]. u i nabývá hodnot z intervalu [ 1, +1].
Řízení rychlosti vozu F1 Předpokládáme, že řídící proměnná u i je konstantní v segmentu [i, i + 1]. u i nabývá hodnot z intervalu [ 1, +1]. Záporné hodnoty u i odpovídají brzdění.
Řízení rychlosti vozu F1 Předpokládáme, že řídící proměnná u i je konstantní v segmentu [i, i + 1]. u i nabývá hodnot z intervalu [ 1, +1]. Záporné hodnoty u i odpovídají brzdění. Kladné hodnoty u i představují plynový pedál.
Řízení rychlosti vozu F1 Předpokládáme, že řídící proměnná u i je konstantní v segmentu [i, i + 1]. u i nabývá hodnot z intervalu [ 1, +1]. Záporné hodnoty u i odpovídají brzdění. Kladné hodnoty u i představují plynový pedál. Proměnná u i řídí zrychlování/zpomalování vozu a i podle: a i = { a max t u i c v (v i ) 2 když u i 0 at min u i c v (v i ) 2 když u i < 0,
Řízení rychlosti vozu F1 Předpokládáme, že řídící proměnná u i je konstantní v segmentu [i, i + 1]. u i nabývá hodnot z intervalu [ 1, +1]. Záporné hodnoty u i odpovídají brzdění. Kladné hodnoty u i představují plynový pedál. Proměnná u i řídí zrychlování/zpomalování vozu a i podle: a i = { a max t u i c v (v i ) 2 když u i 0 at min u i c v (v i ) 2 když u i < 0, a max t je maximální dopředné zrychlení (u F1 je 16 m/s 2 ),
Řízení rychlosti vozu F1 Předpokládáme, že řídící proměnná u i je konstantní v segmentu [i, i + 1]. u i nabývá hodnot z intervalu [ 1, +1]. Záporné hodnoty u i odpovídají brzdění. Kladné hodnoty u i představují plynový pedál. Proměnná u i řídí zrychlování/zpomalování vozu a i podle: a i = { a max t u i c v (v i ) 2 když u i 0 at min u i c v (v i ) 2 když u i < 0, at max je maximální dopředné zrychlení (u F1 je 16 m/s 2 ), at min je maximální dopředné zpomalení (u F1 je 18 m/s 2 ) a
Řízení rychlosti vozu F1 Předpokládáme, že řídící proměnná u i je konstantní v segmentu [i, i + 1]. u i nabývá hodnot z intervalu [ 1, +1]. Záporné hodnoty u i odpovídají brzdění. Kladné hodnoty u i představují plynový pedál. Proměnná u i řídí zrychlování/zpomalování vozu a i podle: a i = { a max t u i c v (v i ) 2 když u i 0 at min u i c v (v i ) 2 když u i < 0, at max je maximální dopředné zrychlení (u F1 je 16 m/s 2 ), at min je maximální dopředné zpomalení (u F1 je 18 m/s 2 ) a c v označuje koeficient pro zpomalení způsobené odporem vzduchu (u F1 je 0, 0021).
Chování vozu F1 Jízda na plný plyn (u = 100%) Maximální brzdění (u = 100%) speed [km/h] 100 150 200 250 300 speed [km/h] 0 50 100 150 200 250 300 0 200 400 600 800 1000 distance [m] 0 50 100 150 200 distance [m]
Okruh F1 Silverstone (Bridge version) Délka: 5.140 metrů
Okruh F1 Silverstone (Bridge version) Délka: 5.140 metrů Používal se pro Velkou cenu Velké Británie v letech 2000 2009.
Okruh F1 Silverstone (Bridge version) Nejrychlejší okruh v roce 2009 při kvalifikaci Velké ceny Velké Británie zajel Sebastian Vettel na voze Red Bull-Renault.
Okruh F1 Silverstone (Bridge version) Nejrychlejší okruh v roce 2009 při kvalifikaci Velké ceny Velké Británie zajel Sebastian Vettel na voze Red Bull-Renault. Čas: 78.119 s.
Profil poloměrů zatáček i v i r i Dráha vozu je charakterizovaná poloměrem zatáček v každém bodě dráhy profil poloměrů zatáček
Profil poloměrů zatáček i v i r i Dráha vozu je charakterizovaná poloměrem zatáček v každém bodě dráhy profil poloměrů zatáček Předpokládáme, že v každém segmentu dráhy [i, i + 1] je poloměr r i konstantní a je znám.
Profil poloměrů zatáček pro okruh F1 Silverstone Radius [m] 0 100 200 300 400 0 1000 2000 3000 4000 5000 Lap distance[m]
Rychlostní profil Poloměr zatáčky r i určuje maximální možnou rychlost v i a max n r i,
Rychlostní profil Poloměr zatáčky r i určuje maximální možnou rychlost v i a max n r i, kde an max je maximální dovolené boční zrychlení, které pro typický vůz F1 je 30 m/s 2, tedy více jak 3g.
Rychlostní profil Poloměr zatáčky r i určuje maximální možnou rychlost v i a max n r i, kde an max je maximální dovolené boční zrychlení, které pro typický vůz F1 je 30 m/s 2, tedy více jak 3g. Právě došlo k překročení a max n
Profil maximální rychlosti pro okruh F1 Silverstone Maximum Speed [km/h] 0 100 200 300 400 0 1000 2000 3000 4000 5000 Lap distance [m]
Omezení řídících signálů Maximální dopředné zrychlení dané vlastnostmi pneumatik
Omezení řídících signálů Maximální dopředné zrychlení dané vlastnostmi pneumatik a max t u a max t an a max n
Omezení řídících signálů Maximální dopředné zrychlení dané vlastnostmi pneumatik a max t u a max t an a max n ( u a max ) 2 t at max + ( ) 2 an an max 1 if u 0
Omezení řídících signálů Maximální dopředné zrychlení dané vlastnostmi pneumatik a max t u a max t an a max n ( u a max ) 2 t at max + V důsledku toho je řízení omezeno na: u ( ) 2 an an max 1 if u 0 1 ( ) 4 vi vi max.
Omezení řídících signálů Maximální dopředné zrychlení dané vlastnostmi pneumatik a max t u a max t an a max n ( u a max ) 2 t at max + V důsledku toho je řízení omezeno na: u ( ) 2 an an max 1 if u 0 1 Podobné omezení platí i pro brzdění. ( ) 4 vi vi max.
Zadání úlohy Cílem je nalézt rychlostní profil vozu F1 v i, i = 0,..., n, pro který platí, že:
Zadání úlohy Cílem je nalézt rychlostní profil vozu F1 v i, i = 0,..., n, pro který platí, že: minimalizuje celkový čas T 0 = n i=1 t i projetí trasy,
Zadání úlohy Cílem je nalézt rychlostní profil vozu F1 v i, i = 0,..., n, pro který platí, že: minimalizuje celkový čas T 0 = n i=1 t i projetí trasy, splňuje rychlostní omezení pro všechny body trasy a
Zadání úlohy Cílem je nalézt rychlostní profil vozu F1 v i, i = 0,..., n, pro který platí, že: minimalizuje celkový čas T 0 = n i=1 t i projetí trasy, splňuje rychlostní omezení pro všechny body trasy a splňuje řídící omezení pro všechny body trasy.
Zadání úlohy Cílem je nalézt rychlostní profil vozu F1 v i, i = 0,..., n, pro který platí, že: minimalizuje celkový čas T 0 = n i=1 t i projetí trasy, splňuje rychlostní omezení pro všechny body trasy a splňuje řídící omezení pro všechny body trasy.
Ve které hře lze očekávat větší finanční zisk?
Ve které hře lze očekávat větší finanční zisk? (A) Padne-li šestka, získáte 60 Kč. Padne-li jiný počet ok, nezískáte nic.
Ve které hře lze očekávat větší finanční zisk? (A) Padne-li šestka, získáte 60 Kč. Padne-li jiný počet ok, nezískáte nic. (B) Padne-li sudý počet ok, získáte 30 Kč. Padne-li lichý počet ok, nezískáte nic.
Ve které hře lze očekávat větší finanční zisk? (A) Padne-li šestka, získáte 60 Kč. Padne-li jiný počet ok, nezískáte nic. u = P(X = 6) 60 + P(X 6) 0 = 1 60 = 10 6 (B) Padne-li sudý počet ok, získáte 30 Kč. Padne-li lichý počet ok, nezískáte nic.
Ve které hře lze očekávat větší finanční zisk? (A) Padne-li šestka, získáte 60 Kč. Padne-li jiný počet ok, nezískáte nic. u = P(X = 6) 60 + P(X 6) 0 = 1 60 = 10 6 (B) Padne-li sudý počet ok, získáte 30 Kč. Padne-li lichý počet ok, nezískáte nic. v = P(X {2, 4, 6}) 30 + P(X {1, 2, 3}) 0 = 1 30 = 15 2
Ve které hře lze očekávat větší finanční zisk? (A) Padne-li šestka, získáte 60 Kč. Padne-li jiný počet ok, nezískáte nic. u = P(X = 6) 60 + P(X 6) 0 = 1 60 = 10 6 (B) Padne-li sudý počet ok, získáte 30 Kč. Padne-li lichý počet ok, nezískáte nic. v = P(X {2, 4, 6}) 30 + P(X {1, 2, 3}) 0 = 1 30 = 15 2 Hra (B) má větší očekávaný zisk.
Rozhodovací diagram pro hod kostkou
Rozhodovací diagram pro hod kostkou v akci
Rozhodovací diagram pro hod kostkou v akci
Rozhodovací diagram pro hod kostkou v akci
Rozhodovací diagram pro hod kostkou v akci
Rozhodovací diagram pro rychlostní profil vozu F1 (pro dva segmenty)
Řešení problému - Bellmanův princip optimality Příklad: Známe optim. hodnoty v i + 1, hledáme optim. hodnoty v i. s = 10, vi+1 max = 110, V = {60, 80, 100, 120} (vzdálenosti uvádíme v metrech, rychlost v km/h)
Řešení problému - Bellmanův princip optimality Příklad: Známe optim. hodnoty v i + 1, hledáme optim. hodnoty v i. s = 10, vi+1 max = 110, V = {60, 80, 100, 120} (vzdálenosti uvádíme v metrech, rychlost v km/h) v i u i v i+1 120 +1.00 134 0.00 117 1.00 96 100 +1.00 117 0.00 98 1.00 70
Řešení problému - Bellmanův princip optimality Příklad: Známe optim. hodnoty v i + 1, hledáme optim. hodnoty v i. s = 10, vi+1 max = 110, V = {60, 80, 100, 120} (vzdálenosti uvádíme v metrech, rychlost v km/h) v i u i v i+1 t i+1 120 0.37 110 0.31 1.00 96 0.33 100 +0.61 110 0.34 0.00 98 0.36 1.00 70 0.42
Řešení problému - Bellmanův princip optimality Příklad: Známe optim. hodnoty v i + 1, hledáme optim. hodnoty v i. s = 10, vi+1 max = 110, V = {60, 80, 100, 120} (vzdálenosti uvádíme v metrech, rychlost v km/h) v i u i t i+1 v i+1 p(v i+1 ) v i+1 v i+1 p(v i+1 ) 120 0.37 0.31 120 0.5 100 0.5 110 1.00 0.33 100 0.8 80 0.2 96 100 +0.61 0.34 120 0.5 100 0.5 110 0.00 0.36 100 0.9 80 0.1 98 1.00 0.42 80 0.5 60 0.5 70
Řešení problému - Bellmanův princip optimality Příklad: Známe optim. hodnoty v i + 1, hledáme optim. hodnoty v i. s = 10, vi+1 max = 110, V = {60, 80, 100, 120} (vzdálenosti uvádíme v metrech, rychlost v km/h) v i u i t i+1 v i+1 p(v i+1 ) T i+1(v i+1 ) E(T i+1(v i+1 )) 120 0.37 0.31 120 0.5 5.43 100 0.5 5.47 5.45 1.00 0.33 100 0.8 5.47 80 0.2 5.53 5.48 100 +0.61 0.34 120 0.5 5.43 100 0.5 5.47 5.45 0.00 0.36 100 0.9 5.47 80 0.1 5.53 5.48 1.00 0.42 80 0.5 5.53 60 0.5 5.61 5.57 E(T i+1(v i+1 )) = v i+1 p(v i+1 ) T i+1(v i+1 )
Řešení problému - Bellmanův princip optimality Příklad: Známe optim. hodnoty v i + 1, hledáme optim. hodnoty v i. s = 10, vi+1 max = 110, V = {60, 80, 100, 120} (vzdálenosti uvádíme v metrech, rychlost v km/h) v i u i t i+1 E(T i+1(v i+1 )) T i = t i+1 + E(T i+1(v i+1 )) 120 0.37 0.31 5.45 5.76 1.00 0.33 5.48 5.81 100 +0.61 0.34 5.45 5.79 0.00 0.36 5.48 5.84 1.00 0.42 5.57 5.99
Řešení problému - Bellmanův princip optimality Příklad: Známe optim. hodnoty v i + 1, hledáme optim. hodnoty v i. s = 10, vi+1 max = 110, V = {60, 80, 100, 120} (vzdálenosti uvádíme v metrech, rychlost v km/h) v i u i Ti 120 0.37 5.76 1.00 5.81 100 +0.61 5.79 0.00 5.84 1.00 5.99
Řešení problému - Bellmanův princip optimality Příklad: Známe optim. hodnoty v i + 1, hledáme optim. hodnoty v i. s = 10, vi+1 max = 110, V = {60, 80, 100, 120} (vzdálenosti uvádíme v metrech, rychlost v km/h) v i ui ti+1 v i+1 120 0.37 5.76 110 100 +0.61 5.79 110 Tyto hodnoty použijeme při výpočtu v kroku i 1.
Řešení problému - Bellmanův princip optimality Příklad: Známe optim. hodnoty v i + 1, hledáme optim. hodnoty v i. s = 10, vi+1 max = 110, V = {60, 80, 100, 120} (vzdálenosti uvádíme v metrech, rychlost v km/h) v i ui ti+1 v i+1 120 0.37 5.76 110 100 +0.61 5.79 110 Tyto hodnoty použijeme při výpočtu v kroku i 1. Bellmanův princip optimality zaručuje, že v kroku i = 0 známe optimální hodnotu celkového času T 0 (v 0 ) pro každou startovní rychlost v 0 a optimální řešení získáme aplikací optimálního řídícího signálu u i (v i ) a výpočtem v i+1 = v(u i (v i ), v i ) pro i = 0, 1,..., n 1, kde v 0 = v 0.
Jak řízení reálně vypadá? Video jízdy Sebastiana Vettela při nejrychlejším projetí okruhu F1 Silverstone v jeho desetileté historii.
Porovnání rychlostních profilů Omezení na maximální rychlost Speed [km/h] 0 100 200 300 400 Max. allowed speed 0 1000 2000 3000 4000 5000 Lap distance [m]
Porovnání rychlostních profilů Řešení pomocí rozhodovacího diagramu čas 84.0 s. Speed [km/h] 0 100 200 300 400 Max. allowed speed Influence diagram 0 1000 2000 3000 4000 5000 Lap distance [m]
Porovnání rychlostních profilů Řešení pomocí rozhodovacího diagramu čas 84.0 s. Analytické řešení čas 82.7 s. Speed [km/h] 0 100 200 300 400 Max. allowed speed Influence diagram Analytical sol. [Velenis et al.] 0 1000 2000 3000 4000 5000 Lap distance [m]
Porovnání rychlostních profilů Řešení pomocí rozhodovacího diagramu čas 84.0 s. Analytické řešení čas 82.7 s. Testovací pilot čas 85.8 s. (S. Vettel 78.119 s.) Speed [km/h] 0 100 200 300 400 Max. allowed speed Influence diagram Testing pilot 0 1000 2000 3000 4000 5000 Lap distance [m]
Dodržování řídících omezení Řešení pomocí rozhodovacího diagramu Control [%] 100 50 0 50 100 0 1000 2000 3000 4000 5000 Lap distance [m]
Dodržování řídících omezení Testovací pilot (řízení je zpětně rekonstruované z rychlosti) Control [%] 100 50 0 50 100 0 1000 2000 3000 4000 5000 Lap distance [m]
Shrnutí Řešení pomocí rozhodovacího diagramu je srovnatelné s analytickým řešením.
Shrnutí Řešení pomocí rozhodovacího diagramu je srovnatelné s analytickým řešením. Díky rozložitelnosti opimalizované užitkové funkce jsou výpočty prováděné lokálně, což je výpočetně efektivní.
Shrnutí Řešení pomocí rozhodovacího diagramu je srovnatelné s analytickým řešením. Díky rozložitelnosti opimalizované užitkové funkce jsou výpočty prováděné lokálně, což je výpočetně efektivní. Rozhodovací diagramy mají výhodu, že mohou poskytnout řešení i tehdy, když analytické řešení není známé.
Shrnutí Řešení pomocí rozhodovacího diagramu je srovnatelné s analytickým řešením. Díky rozložitelnosti opimalizované užitkové funkce jsou výpočty prováděné lokálně, což je výpočetně efektivní. Rozhodovací diagramy mají výhodu, že mohou poskytnout řešení i tehdy, když analytické řešení není známé. V rozhodovacích diagramech lze snadno a rychle upravit optimalizovanou užitkovou funkci např. v případě mokrého povrchu můžeme změnit maximální dovolené boční zrychlení nebo také přidat penalizaci za prudké brzdění.
Shrnutí Řešení pomocí rozhodovacího diagramu je srovnatelné s analytickým řešením. Díky rozložitelnosti opimalizované užitkové funkce jsou výpočty prováděné lokálně, což je výpočetně efektivní. Rozhodovací diagramy mají výhodu, že mohou poskytnout řešení i tehdy, když analytické řešení není známé. V rozhodovacích diagramech lze snadno a rychle upravit optimalizovanou užitkovou funkci např. v případě mokrého povrchu můžeme změnit maximální dovolené boční zrychlení nebo také přidat penalizaci za prudké brzdění. Nyní pracujeme na rozhodovacích diagramech pro jiná vozidla.
Shrnutí Řešení pomocí rozhodovacího diagramu je srovnatelné s analytickým řešením. Díky rozložitelnosti opimalizované užitkové funkce jsou výpočty prováděné lokálně, což je výpočetně efektivní. Rozhodovací diagramy mají výhodu, že mohou poskytnout řešení i tehdy, když analytické řešení není známé. V rozhodovacích diagramech lze snadno a rychle upravit optimalizovanou užitkovou funkci např. v případě mokrého povrchu můžeme změnit maximální dovolené boční zrychlení nebo také přidat penalizaci za prudké brzdění. Nyní pracujeme na rozhodovacích diagramech pro jiná vozidla. Teoretický výzkum: rozhodovací diagramy se spojitými veličinami.
Solving the influence diagram Strong junction tree method (Jensen et. al., 1994). A i 1, V i 1 C V i 1 A i 1, V i 1, V i C A i V i U i, A i, V i Φ = P(A i U i, V i ) Ψ = 0 C V i A i, V i A i, V i, V i+1 Φ = P(V i+1 A i, V i ) Ψ = f (T i+1 V i, V i+1 ) V i+1
Solving the influence diagram Strong junction tree method (Jensen et. al., 1994). Elimination of utility nodes T i, i {1,..., n}. C V i 1 A i 1, V i 1 A i 1, V i 1, V i C A i V i U i, A i, V i Φ = P(A i U i, V i ) Ψ = 0 C V i A i, V i A i, V i, V i+1 Φ = P(V i+1 A i, V i ) Ψ = f (T i+1 V i, V i+1 ) V i+1
Solving the influence diagram Strong junction tree method (Jensen et. al., 1994). Elimination of utility nodes T i, i {1,..., n}. For each path segment [i, i + 1], i {0,..., n 1} two cliques are created in the strong junction tree. C V i 1 C A i A i 1, V i 1 A i 1, V i 1, V i V i U i, A i, V i Φ = P(A i U i, V i ) Ψ = 0 C V i A i, V i A i, V i, V i+1 Φ = P(V i+1 A i, V i ) Ψ = f (T i+1 V i, V i+1 ) V i+1
Solving the influence diagram Strong junction tree method (Jensen et. al., 1994). Elimination of utility nodes T i, i {1,..., n}. For each path segment [i, i + 1], i {0,..., n 1} two cliques are created in the strong junction tree. To each clique a probability potential Φ and a utility potential Ψ is assigned. C V i 1 C A i C V i A i 1, V i 1 A i 1, V i 1, V i V i U i, A i, V i A i, V i A i, V i, V i+1 Φ = P(A i U i, V i ) Ψ = 0 Φ = P(V i+1 A i, V i ) Ψ = f (T i+1 V i, V i+1 ) V i+1
Solving the influence diagram Strong junction tree method (Jensen et. al., 1994). Elimination of utility nodes T i, i {1,..., n}. For each path segment [i, i + 1], i {0,..., n 1} two cliques are created in the strong junction tree. To each clique a probability potential Φ and a utility potential Ψ is assigned. Each conditional probability distribution and each utility function is assigned to a clique that contains all its variables. C V i 1 C A i C V i A i 1, V i 1 A i 1, V i 1, V i V i U i, A i, V i A i, V i A i, V i, V i+1 V i+1 Φ = P(A i U i, V i ) Ψ = 0 Φ = P(V i+1 A i, V i ) Ψ = f (T i+1 V i, V i+1 )
Solving the influence diagram Strong junction tree method (Jensen et. al., 1994). Elimination of utility nodes T i, i {1,..., n}. For each path segment [i, i + 1], i {0,..., n 1} two cliques are created in the strong junction tree. To each clique a probability potential Φ and a utility potential Ψ is assigned. Each conditional probability distribution and each utility function is assigned to a clique that contains all its variables. The arrows correspond to the order the computations are performed. C V i 1 C A i C V i A i 1, V i 1 A i 1, V i 1, V i V i U i, A i, V i A i, V i A i, V i, V i+1 V i+1 Φ = P(A i U i, V i ) Ψ = 0 Φ = P(V i+1 A i, V i ) Ψ = f (T i+1 V i, V i+1 )
Solving the influence diagram the basic operations Let A denote the summation over all states of variable A.
Solving the influence diagram the basic operations Let A denote the summation over all states of variable A. Let max D denote the maximization over all states of variable D.
Solving the influence diagram the basic operations Let A denote the summation over all states of variable A. Let max D denote the maximization over all states of variable D. M is a generalized variable marginalization: Φ(B) = M A Φ(A, B) = A Φ(A, B) Ψ(E) = M Ψ(D, E) = max Ψ(D, E). D D
Solving the influence diagram the basic operations Let A denote the summation over all states of variable A. Let max D denote the maximization over all states of variable D. M is a generalized variable marginalization: Φ(B) = M A Φ(A, B) = A Φ(A, B) Ψ(E) = M Ψ(D, E) = max Ψ(D, E). D D For a set of variables C the symbol M C Φ denotes a sequence of (single-)variable marginalizations.
Solving the influence diagram the strong junction tree A i 1, V i 1 C V i 1 A i 1, V i 1, V i Φ = Φ Φ S, C A i V i U i, A i, V i Φ = P(A i U i, V i ) Ψ = 0 Ψ S, Φ S C V i A i, V i A i, V i, V i+1 Φ = P(V i+1 A i, V i ) Ψ = f (T i+1 V i, V i+1 ) V i+1 Ψ S, Φ S
Solving the influence diagram the strong junction tree A i 1, V i 1 C V i 1 C A i A i 1, V i 1, V i V i Φ = P(A i U i, V i ) Ψ = 0 U i, A i, V i Φ = Φ Φ S, Ψ = Ψ + Ψ S Φ S Ψ S, Φ S C V i A i, V i A i, V i, V i+1 Φ = P(V i+1 A i, V i ) Ψ = f (T i+1 V i, V i+1 ) V i+1 Ψ S, Φ S
Solving the influence diagram the strong junction tree A i 1, V i 1 C V i 1 C A i A i 1, V i 1, V i V i Φ = P(A i U i, V i ) Ψ = 0 U i, A i, V i Φ = Φ Φ S, Ψ = Ψ + Ψ S Φ S Φ S = M C\S Φ, Ψ S, Φ S C V i A i, V i A i, V i, V i+1 Φ = P(V i+1 A i, V i ) Ψ = f (T i+1 V i, V i+1 ) V i+1 Ψ S, Φ S
Solving the influence diagram the strong junction tree A i 1, V i 1 C V i 1 C A i A i 1, V i 1, V i V i Φ = P(A i U i, V i ) Ψ = 0 U i, A i, V i Ψ S, Φ S Φ = Φ Φ S, Ψ = Ψ + Ψ S Φ S Φ S = M C\S Φ, Ψ S = M C\S (Φ Ψ ) C V i A i, V i A i, V i, V i+1 Φ = P(V i+1 A i, V i ) Ψ = f (T i+1 V i, V i+1 ) V i+1 Ψ S, Φ S
Solving the influence diagram the strong junction tree A i 1, V i 1 C V i 1 C A i C V i A i 1, V i 1, V i V i Φ = P(A i U i, V i ) Ψ = 0 U i, A i, V i Ψ S, Φ S A i, V i Φ = P(V i+1 A i, V i ) Ψ = f (T i+1 V i, V i+1 ) A i, V i, V i+1 Ψ S, Φ S V i+1 Φ = Φ Φ S, Ψ = Ψ + Ψ S Φ S Φ S = M C\S Φ, Ψ S = M C\S (Φ Ψ ) Since potentials are sparse we use the zero compression method (Andersen et al., 1990) to speed-up the computations.