Státnicová otázka 6, okruh 1



Podobné dokumenty
3. ANTAGONISTICKÉ HRY

ANTAGONISTICKE HRY 172

Teorie her a ekonomické rozhodování. 2. Maticové hry

Matematika pro informatiky

Matematika 5 FSV UK, ZS Miroslav Zelený

Základní spádové metody

Vlastní (charakteristická) čísla a vlastní (charakteristické) Pro zadanou čtvercovou matici A budeme řešit maticovou

Úvod do optimalizace Matematické metody pro ITS (11MAMY)

Operační výzkum. Teorie her. Hra v normálním tvaru. Optimální strategie. Maticové hry.

Funkce v ıce promˇ enn ych Extr emy Pˇredn aˇska p at a 12.bˇrezna 2018

Lineární programování

TGH13 - Teorie her I.

5. Lokální, vázané a globální extrémy

Teorie her a ekonomické rozhodování. 3. Dvoumaticové hry (Bimaticové hry)

fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu (reg. č. CZ.1.07/2.2.00/28.

LDF MENDELU. Simona Fišnarová (MENDELU) Základy lineárního programování VMAT, IMT 1 / 25

Numerické metody optimalizace - úvod

Nelineární optimalizace a numerické metody (MI NON)

IX. Vyšetřování průběhu funkce

f ( x) = 5x 1 + 8x 2 MAX, 3x x ,

DERIVACE FUKNCÍ VÍCE PROMĚNNÝCH

4EK311 Operační výzkum. 1. Úvod do operačního výzkumu

EXTRÉMY FUNKCÍ VÍCE PROMĚNNÝCH

Úvod do teorie her

Bakalářská matematika I

APLIKACE. Poznámky Otázky

12. Lineární programování

ANALÝZA A KLASIFIKACE DAT

Problém lineární komplementarity a kvadratické programování

Operační výzkum. Teorie her cv. Hra v normálním tvaru. Optimální strategie. Maticové hry.

Numerické metody 6. května FJFI ČVUT v Praze

Elektrotechnická fakulta

9. přednáška 26. listopadu f(a)h < 0 a pro h (0, δ) máme f(a 1 + h, a 2,..., a m ) f(a) > 1 2 x 1

4EK201 Matematické modelování. 2. Lineární programování

Základy matematiky pro FEK

DEFINICE,VĚTYADŮKAZYKÚSTNÍZKOUŠCEZMAT.ANALÝZY Ib

Úvod do optimalizace, metody hladké optimalizace

4EK213 LINEÁRNÍ MODELY

Matematika B101MA1, B101MA2

MATURITNÍ TÉMATA Z MATEMATIKY

Dnešní látka: Literatura: Kapitoly 3 a 4 ze skript Karel Rektorys: Matematika 43, ČVUT, Praha, Text přednášky na webové stránce přednášejícího.

Hledání extrémů funkcí

Co jsme udělali: Au = f, u D(A)

Simplexová metoda. Simplexová tabulka: Záhlaví (účelová funkce) A ~ b r βi. z j c j. z r

Otázky ke státní závěrečné zkoušce

MATEMATIKA A Metodický list č. 1

aneb jiný úhel pohledu na prvák

OPTIMALIZACE. (přehled metod)

1. července 2010

1 Duální simplexová metoda

OPTIMALIZACE A MULTIKRITERIÁLNÍ HODNOCENÍ FUNKČNÍ ZPŮSOBILOSTI POZEMNÍCH STAVEB D24FZS

Aplikovaná numerická matematika

Maturitní témata profilová část

Učební texty k státní bakalářské zkoušce Matematika Základy lineárního programování. študenti MFF 15. augusta 2008

Extrémy funkce dvou proměnných

Definice globální minimum (absolutní minimum) v bodě A D f, jestliže X D f

fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu (reg. č. CZ.1.07/2.2.00/28.

Funkce a lineární funkce pro studijní obory

Obecná úloha lineárního programování

Mgr. Ladislav Zemánek Maturitní okruhy Matematika Obor reálných čísel

Aproximace funkcí. Numerické metody 6. května FJFI ČVUT v Praze

Matematika B 2. Úvodní informace

Numerická matematika 1

Obecná úloha lineárního programování. Úloha LP a konvexní množiny Grafická metoda. Jiří Neubauer. Katedra ekonometrie FEM UO Brno

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

Stručný přehled učiva

Jméno... Cvičení den... hodina... Datum...rok... Počet listů... Varianta A

EXTRÉMY FUNKCÍ VÍCE PROMĚNNÝCH

KOOPERATIVNI HRY DVOU HRA CˇU

U Úvod do modelování a simulace systémů

B) výchovné a vzdělávací strategie jsou totožné se strategiemi vyučovacího předmětu Matematika.

Vysoké učení technické v Brně, Fakulta strojního inženýrství MATEMATIKA 2

FIT ČVUT MI-LOM Lineární optimalizace a metody. Dualita. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

4EK213 LINEÁRNÍ MODELY

Soustavy linea rnı ch rovnic

4EK213 Lineární modely. 12. Dopravní problém výchozí řešení

Gymnázium Česká a Olympijských nadějí, České Budějovice, Česká 64, 37021

Dnešní látka Variačně formulované okrajové úlohy zúplnění prostoru funkcí. Lineární zobrazení.

Typy příkladů na písemnou část zkoušky 2NU a vzorová řešení (doc. Martišek 2017)


Soustavy. Terminologie. Dva pohledy na soustavu lin. rovnic. Definice: Necht A = (a i,j ) R m,n je matice, b R m,1 je jednosloupcová.

Pavlína Matysová. 5. listopadu 2018

Učební texty k státní bakalářské zkoušce Matematika Základy teorie funkcí více proměnných. študenti MFF 15. augusta 2008

13. Lineární programování

0.1 Úvod do lineární algebry

Průvodce studiem. do bodu B se snažíme najít nejkratší cestu. Ve firmách je snaha minimalizovat

MATEMATIKA B. Lineární algebra I. Cíl: Základním cílem tohoto tématického celku je objasnit některé pojmy lineární algebry a

Ekonomická formulace. Matematický model

Matematika V. Dynamická optimalizace

Matematika I A ukázkový test 1 pro 2014/2015

Aplikovaná matematika I

verze 1.4 Ekvivalentní podmínkou pro stacionární bod je, že totální diferenciál je nulový

OSA. maximalizace minimalizace 1/22

Princip gradientních optimalizačních metod

Čebyševovy aproximace

Úloha - rozpoznávání číslic

Kapitola 4: Extrémy funkcí dvou proměnných 1/5

Přijímací zkouška na navazující magisterské studium 2014

0.1 Úvod do lineární algebry

Úlohy k přednášce NMAG 101 a 120: Lineární algebra a geometrie 1 a 2,

Transkript:

Státnicová otázka 6, okruh 1 Vojtěch Franc, xfrancv@electra.felk.cvut.cz 7. února 2000 1 Zadání Statické optimalizace. Lineární a nelineární programování. Optimální řízení a rozhodování v dynamických systémech, matematické programování, teorie her, optimální řízení deterministických systémů. Opatrné a důvěřivé strategie řízení. Princip maxima. 2 Statické optimalizace Optimalizační problém je obecně výběr takového řešení, které je v nějakém smyslu optimální. Pro matematickou formulaci optimalizačního problému je třeba vytvořit matematický model situace - systém, který musí umožňovat porovnání různých variant řešení. Obvykle volíme kritérium. V případě, že optimalizujeme situaci, která je popsána statickým modelem, jedná se o statický optimalizační problém. Statický model je popsán pouze algebraickými vztahy mezi veličinami, které jsou časově neproměnné - model situace se v čase nemění. V opačném případě se jedná o dynamický model, resp. když optimalizujeme, tak o dynamický optimalizační problém, který se také často nazývá problém optimálního řízení. 3 Nelineární programování, matematické programování Problémy statické optimalizace jsou v podstatě ekvivalentní s hledáním extrémů funkcí více proměnných (kritéria), které podléhají různým omezením. Těmto problémům se také říká úlohymatematického programování. Základní úloha matematického programování je nalézt extrém (maximum nebo minimum) skalární funkce f(x), kde hledaný vektor x je prvkem nějaké množiny X. Množina X je nejčastěji určena nějakými algebraickými vztahy mezi složkami vektoru x. Základní úloha mat. programování je tedy min{f(x) x X E n } (1) kde E n je n-rozměrný Euklidův prostor. V případě, že funkce f(x) je lineární a algebraické vztahy popisující omezení X jsou lineární (ne)rovnice, pak se jedná o problém lineárního programování. V opačném případě (obecně) se jedná o problém nelineárního programování. Nelineárního programování je popsáno v [3] na straně 6 až 30. Speciální případ, kdy f(x) je kvadratická funkce, je popsán na straně 31 až 49. V uvedených kapitolách jsou matematické věty a definice, které popisují podmínky pro analytické řešení. Většinu věcí jsme probírali v matematice, např. [2], kapitola Extrémy funkcí více proměnných. Zde se pokusím vyjmenovat a stručně popsat nejdůležitější z nich. 1

Podmínky prvního a druhého řádu; [2], [3], str 9-11. Má-li v bodě x funkce extrém, pak je její první derivace rovna 0. Hledáme-li minimum x, pak v x musí být druhá derivace kladná (konvexní funkce). Zobecnění těchto vět na vícerozměrný případ jsou podmínky prvního a druhého řádu. Vázané extrémy, Lagrangeovy multiplikátory; [2], [3], str 11-16. Hledáme-li extrém funkce, kdy jsou omezení dána soustavou rovnic g(x) = 0, pak pro tento extrém musí platit podmínky, které se vyjádří pomocí Lagrangeovy funkce L(x, λ) = f(x) + λg(x). λ jsou Lagran. multiplikátory. Kuhn-Tuckerovy podmínky; [3], str 17-19. Udávají podmínky pro extrém nelineární funkce f(x), kdy je omezení určené rovnicemi g(x) = 0 a nerovnicemi q(x) 0. Primární a duální úloha, sedlový bod; [3] str 19-23. Optimalizační problém omezené funkce min{f(x) g(x) 0}, lze vyjádřit jako což je primární úloha. Nebo to lze vyjádřit jako min max L(x, λ), (2) x g(x) 0 λ 0 max λ 0 min x g(x) 0 L(x, λ), (3) což se jmenuje duální úloha. V případě, kdy má primární a duální úloha řešení ve stejném bodě, nazývá se tento bod sedlový. Této věci se využívá v numerických algoritmech, primární úloha se blíží k řešení shora a duální se k němu blíže zdola. Všechny věty jsme brali v matice kromě Kuhn-Tuckerových podmínek, které jsou hodně důležité, proto je zde uvedu v přesném znění jak jsou v [3]. Obecný případ nelineárního programování lze zapsat min{f(x) h(x) = 0; g(x) 0} (4) Podmínky pro relativní extrém lze popsat pomocí Kuhn-Tuckerových podmínek. Necht x je bod relativního minima problému (4) a předpokládáme, že x je regulární bod omezení. Pak existuje vektor λ E n a vektor µ E p, že Kde f(x) = [ f(x) x 1 f(x ) + λ T h(x ) + µ T g(x ) = 0 (5)... f(x) x n ] je gradient. µ T g(x ) = 0 (6) µ 0 (7) (8) Kvadratické programování. V případě, že je optimalizovaná funkce f(x) kvadratická a nemáme žádné omezení na X, lze vypočítat optimální x analyticky. Pro vyjádření řešení potřebujeme spočítat inverzní matici. Kvadratická funkce je v praxi hodně používaná, např. je třeba při metodě nejmenších čtverců. 2

Kromě speciálních případů, které se dají vypočítat analyticky (např. neomezená kvadr. fce), se pro nelineární programování používají numerické algoritmy. V [3] na straně 98 až 158, je jich uvedena velká řada. Pokud není funkce unimodální (má jen jeden extrém) jsou algoritmy schopné nalézt pouze lokální extrém. Většina používaných metod je založena na gradientní optimalizaci, t.j. počítá se gradient optimalizované funkce a v jeho směru se upravuje řešení, to se dělá tak dlouho, dokud se nenalezne extrém. Všechny tyto metody stojí na tom, že fce f(x) je diferencovatelná 1 4 Lineární programování Základní úloha lineárního programování (LP) má tvar max{c T x A x b} (9) Je to úloha na maximum, omezení jsou ve tvaru Ax b, ve které jsou pravé strany omezení nezáporné b 0. Úloha lineárního programování má několik ekvivalentních vyjádření, vyjádření (9) se nazývá Normální úloha LP. Na úloha LP jednak vede mnoho praktických problémů a jednak jsou na ni převáděny i problémy, které nejsou lineární. Její výhodou je, že existuje algoritmus Simplexová metoda, který ji umí řešit. Její popis je uveden v [3] na straně 47 až 71. Zde se pokusím stručně popsat její princip. Množina omezení X je daná soustavou nerovnic Ax b. Tyto nerovnice určují oblast v prostoru E n, která je ohraničená přímkami (lin. rovnice určují přímku). V našem případě, kdy je optimalizovaná funkce lineární, musí její extrém ležet na této hranici X (lze si to představit jako rovinu, která je ořezána přímkami, takže její nejvyšší bod musí být na kraji). Simplexová metoda v podstatě prochází hranici určenou Ax = b a hledá největší hodnotu fce c T x. 5 Teorie her V [3] je teorie her popsaná na straně 72-96. Zde je stručný výtah. Hra v normálním tvaru je obecně definována {Q, X 1,..., X n, J 1 (x 1,..., x n ),..., J n (x 1,..., x n )} (10) kde Q = {1, 2,..., n} jsou hráči, X 1 až X 2 jsou množiny strategii hráčů 1 až n, x j X j je konkrétní strategie hráče j a J j (x 1,..., x n ) jsou výhry hráče j. Konečná hra je taková, v níž je množina strategií konečná (hráč má konečný počet rozhodnutí). Hra s konečným součtem je taková hra, v níž při všech strategiích hráčů je součet výher všech hráčů konstantní, tj. n J i (x 1,..., x n ) = K, x i X i, (11) i=1 v opačném případě se jedná o hru s nekonstantním součtem. V [3] jsou popisovány konečné hry dvou hráčů Q = {1, 2}. Tyto hry se dají popsat maticí, jedná se o maticové hry. 1 Existuje věta o gradientní optimalizaci se zobecněným gradientem, která umožňuje počítat zobecněný gradient i nediferencovatelných fcí. Na tohle se ptát asi nebudou, ale kdyby si chtěl někdo šplhnout... 3

Pro názornost je zde příklad. Hrají dva hráči. Každý hráč má tři možná rozhodnutí, pak se model hry zapsat jako matice 2 3 4 A = 3 4 4 (12) 2 1 6 Volba rozhodnutí (strategie) prvního hráče odpovídá volbě řádku matice A. Volba druhého hráče, odpovídá výběru sloupce matice A. Při výběru i-tého řádku prvním hráčem a j-tého řádku druhým, je cena hry J(i, j) = a i,j. 5.1 Dělení her Antagonistický konflikt. Jedná se o hru s konstantním součtem. Každý hráč má protichůdné zájmy. Cílem prvního hráče je získat co největší část výhry, čímž se zároveň nejvíce poškodí protivník a obráceně (jeden maximalizuje druhý minimalizuje). Hráč jedna hledá rozhodnutí (řádek) i = arg max i min j a i,j a hráč dva hledá rozhodnutí (sloupec) j = arg min j max i a i,j. Zde jsou dva případy: V případě že platí max i min j a i,j = min j max i a i,j, má hra sedlový bod a hráči mohou volit pevné strategie (zvolí konkrétní řádek, resp. sloupec), pak se jedná o ryzí strategie. Když neexistuje sedlový bod, hledá každý hráč smíšenou strategii, tj. pro každé rozhodnutí počítá pravděpodobnost, s jakou se má dané rozhodnutí vybrat. Strategie není dána konkrétním rozhodnutím, ale je dána hustou pravděpodobnosti pro dané rozhodnutí. Rozhodování při riziku a neurčitosti. Zde se předpokládá, že jen jeden z hráčů je inteligentní a druhý hráč volí rozhodnutí náhodně s nějakou hustotou pravděpodobnosti p(v). Zde můžou nastat dvě možnosti Zná-li první hráč rozdělení p(v), pak se jedná o problém rozhodování při riziku. Nezná-li první hráč rozdělení p(v), pak se jedná o problém rozhodování při neurčitosti. Neantagonistický konflikt. Hra s nekonstantním součtem. Hráči se nesnaží poškodit jeden druhého (antagonistický konflikt), ale každý hráč sleduje své vlastní zájmy. Modelem této hry je dvojmatice, první člen je výhra prvního hráče a druhý je výhra druhého hráče. Příklad A = 1; 1 9; 10 9; 10 10; 9 5; 100 0; 0 10; 9 0; 0 5; 5 Neantagonistický konflikt může mít několik variant: (13) Hráči se mezi sebou nemůžou dohadovat, pak se jedná o nekooperativní teorii her. Hráči mezi sebou mohou uzavírat závazné dohody, pak se jedná o kooperativní teorii her. Tento případ se ještě dělí na Kooperativní teorii s přenosnou výhrou. Hráči si mohou výtěžek z hry rozdělit mezi sebe. Kooperativní teorii s nepřenosnou výhrou. Hráči se mohou dohodnout, ale výtěžek ze hry si nelze přerozdělit (úplatek není povolen). 4

6 Optimální řízení a rozhodování v dynamických systémech V dynamických systémech (DS) jsou proměnné modelu situace závislé na čase. V moderní teorii řízení jsou požadavky na kvalitu řízení vyjádřeny volbou kritéria kvality řízení. Problém optimálního řízení je převeden na optimalizační problém minimalizace kritéria kvality řízení. Prvním problémem je volba vhodného kritéria, které zahrne všechny naše požadavky na řízení. Druhý problém je řešitelnost takto formulovatelného kritéria. Zde uvedu výtah z definice DS a kritéria kvality řízení jak je uvedena v [3]: Dynamický systém je obvykle popsán ẋ(t) = f(x, u, t) y(t) = g(x, u, t) (14) kde x(t) je stav, u(t) je řídící vektor a y(t) je vektor výstupů. Veličiny v systému jsou obvykle omezeny Kritérium kvality řízení je obvykle x(t) X R m, u(t) U R n. (15) t1 J(t 0, x(t 0 ), t 1, x(t 1 ), u(t)) = h(x(t 1 )) + g(x(t), u(t), t)dt (16) t 0 kde h a g jsou skalární funkce svých argumentů. První člen kritéria je závislý na stavu v koncovém bodě t 1, tento člen hodnotí cíl. Druhý člen je integrál, který hodnotí průběh trajektorie systému - způsob dosažení cíle. Kritérium (16) je funkcionál, tj. skalární funkce, která má jako argumenty funkci (v našem případě u(t)). Problém optimálního řízení je tedy ekvivalentní s úlohou hledání extrému funkcionálu. Definice problému optimálního řízení je: Problém optimálního řízení spočívá v určení takového řízení u(t) systému (14) na intervalu t 0 t t 1, aby byla splněna omezení (15) a kritérium kvality řízení (16) bylo minimální. Takové řízení je optimální. Nejvíce používaným kritériem kvality řízení je kvadratické kritérium, které pro lineární systémy vede na lineární zákon řízení (zpětnovazební regulátor je lin. systém, tzv. L(inear)Q(uadratic) regulátor). Tímto problémem se zabývá předmět Moderní Teorie Řízení, viz. stejnojmenné skriptum [1] a vypracování [otázka 5/okruh 1]. 6.1 Variační metody Tyto analytické metody určují nutné a postačující podmínky, které musí splňovat extrém funkcionálu - kritéria kvality řízení. Popis těchto metod je v [3] na straně 162-192. Praktickým výsledkem je asi to, že analytické metody lze použít jen v některých spec. případech (viz. LQ). Obecně je výpočet dosti komplikovaný, takže se těžko implementuje regulátor, který by pracoval (stíhal počítat) online. 6.2 Dynamické programování Jiným způsobem jak řešit optimalizační problémy je použití dynamického programování (DP). DP je postaveno na Bellmanově principu optimality. Zde uvádím formulaci jak je v [3] na straně 194 5

Princip optimality tvrdí, že optimální posloupnost rozhodování v mnohastupňovém rozhodovacím procesu (mám na výběr více rozhodnutí) má tu vlastnost, že at jsou jakékoliv vnitřní stavy procesu a předchozí rozhodování, zbylá rozhodování musí tvořit optimální posloupnost vycházející ze stavu, který je výsledkem předchozích rozhodování. Jinými slovy v každém rozhodovacím stupni musíme volit optimální rozhodnutí, přičemž vycházíme ze stavu, ve kterém se právě nacházíme. Princip optimality je v podstatě jinou formulací známého přísloví Neplač nad rozlitým mlékem. Stav, ve kterém právě jsme, je výsledkem předchozích rozhodování a tento stav již nemůžeme ovlivnit, ale naše další rozhodování musí být optimální. Tento princip se nepoužívá jen pro optimální řízení, ale třeba také v Umělé Inteligenci, při hledání cest v grafu atd. V [3] je uveden jednoduchý příklad na straně 194 až 195. Formulace a použití DP na lineárních systémech je v [1] na straně 45 až 49. 7 Princip maxima Pontrjaginův princip maxima je nutnou podmínkou řešení problémů dynamické optimalizace. V [3] je popsán na straně 217 až 227. Je to čistě matematická záležitost, tak že zde nebudu opisovat vzorečky. Ve stručnosti lze říci, že princip maxima vyžaduje, aby při optimálním řízení u (t) byla Hamiltonova funkce H(x, p, u) v každém okamžiku t maximální vůči řízení u(t) (Definice Hamiltonovy funkce je na straně 222 v [3]). 8 Závěr Státnicová otázka 6/okruh 1, kterou jsem se zde snažil vypracovat, v podstatě zahrnuje celý předmět ORR. Jediný dostupný materiál, kterým nám prof. Štecha dal (kromě cizojazyčných knih) byla nedopsaná předloha skripta [3], které už mělo vyjít. Hledal jsem ho ve skriptárně, ale neúspěšně. Kdyby někdo chtěl dokument [3], tak mu ho nahraju. Je tam skoro všechno, kromě otázky co to jsou důvěřivé a opatrné strategie řízení. At jsem hledal jak jsem hledal, tak důvěřivé a opatrné strategie jsem nenašel ani si na ně nevzpomněl. Proto Vás prosím, jestli někdo víte o co jde, tak mi mailněte a já to tam doplním. Reference [1] Štecha Havlena. Moderní Teorie Řízení. ČVUT, Prague, Czech republic, 1996. [2] Průcha Jankovský. Matematická analýza II. ČVUT, Prague, Czech republic, 1992. [3] J. Štecha. ORR, přednášky v postscriptu. nepublikováno, 1998. 6