Úvod do optimalizace Matematické metody pro ITS (11MAMY)

Podobné dokumenty
Matematika pro informatiky

Funkce v ıce promˇ enn ych Extr emy Pˇredn aˇska p at a 12.bˇrezna 2018

OPTIMALIZACE. (přehled metod)

Základní spádové metody

Kapitola 4: Průběh funkce 1/11

Numerické metody 6. května FJFI ČVUT v Praze

Vlastní (charakteristická) čísla a vlastní (charakteristické) Pro zadanou čtvercovou matici A budeme řešit maticovou

4EK201 Matematické modelování. 2. Lineární programování

Definice globální minimum (absolutní minimum) v bodě A D f, jestliže X D f

Numerické metody a programování. Lekce 8

Kapitola 4: Průběh funkce 1/11

Extrémy funkce dvou proměnných

9. přednáška 26. listopadu f(a)h < 0 a pro h (0, δ) máme f(a 1 + h, a 2,..., a m ) f(a) > 1 2 x 1

7.1 Extrémy a monotonie

1 Extrémy funkcí - slovní úlohy

IX. Vyšetřování průběhu funkce

Řešení 1b Máme najít body, v nichž má funkce (, ) vázané extrémy, případně vázané lokální extrémy s podmínkou (, )=0, je-li: (, )= +,

fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu (reg. č. CZ.1.07/2.2.00/28.

3. Přednáška: Line search

Obecná úloha lineárního programování. Úloha LP a konvexní množiny Grafická metoda. Jiří Neubauer. Katedra ekonometrie FEM UO Brno

LDF MENDELU. Simona Fišnarová (MENDELU) Základy lineárního programování VMAT, IMT 1 / 25

10 Funkce více proměnných

Učební texty k státní bakalářské zkoušce Matematika Základy lineárního programování. študenti MFF 15. augusta 2008

Numerické metody a programování. Lekce 7

Lineární klasifikátory

Funkce dvou a více proměnných

OPTIMALIZACE A MULTIKRITERIÁLNÍ HODNOCENÍ FUNKČNÍ ZPŮSOBILOSTI POZEMNÍCH STAVEB D24FZS

4EK213 LINEÁRNÍ MODELY

Učební texty k státní bakalářské zkoušce Matematika Základy teorie funkcí více proměnných. študenti MFF 15. augusta 2008

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

4EK213 LINEÁRNÍ MODELY

Derivace a monotónnost funkce

Hledáme lokální extrémy funkce vzhledem k množině, která je popsána jednou či několika rovnicemi, vazebními podmínkami. Pokud jsou podmínky

Numerické metody optimalizace - úvod

Matematika 5 FSV UK, ZS Miroslav Zelený

Funkce jedn e re aln e promˇ enn e Derivace Pˇredn aˇska ˇr ıjna 2015

7 Konvexní množiny. min c T x. při splnění tzv. podmínek přípustnosti, tj. x = vyhovuje podmínkám: A x = b a x i 0 pro každé i n.

Lineární programování

EXTRÉMY FUNKCÍ VÍCE PROMĚNNÝCH

Matematika V. Dynamická optimalizace

Hledání extrémů funkcí

fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu (reg. č. CZ.1.07/2.2.00/28.

Nelineární optimalizace a numerické metody (MI NON)

Michal Bulant. Masarykova univerzita Fakulta informatiky

1 Funkce dvou a tří proměnných

Příklad 1 ŘEŠENÉ PŘÍKLADY Z M1A ČÁST 6

4EK212 Kvantitativní management. 2. Lineární programování

APLIKACE. Poznámky Otázky

Co je obsahem numerických metod?

1. července 2010

Definice 1.1. Nechť je M množina. Funkci ρ : M M R nazveme metrikou, jestliže má následující vlastnosti:

Přednáška 11, 12. prosince Část 5: derivace funkce

Princip gradientních optimalizačních metod

Základy matematiky pro FEK

Ohraničená Hessova matice ( bordered hessian ) je. Sestrojíme posloupnost determinantů (minorů):

Průvodce studiem. do bodu B se snažíme najít nejkratší cestu. Ve firmách je snaha minimalizovat

Diferenciální počet - II. část (Taylorův polynom, L Hospitalovo pravidlo, extrémy

Matematická analýza pro informatiky I. Extrémy funkcí více proměnných

5. Lokální, vázané a globální extrémy

13. Lineární programování

LDF MENDELU. Simona Fišnarová (MENDELU) Průběh funkce ZVMT lesnictví 1 / 21

Matematika I (KX001) Užití derivace v geometrii, ve fyzice 3. října f (x 0 ) (x x 0) Je-li f (x 0 ) = 0, tečna: x = 3, normála: y = 0

EXTRÉMY FUNKCÍ VÍCE PROMĚNNÝCH

Co jsme udělali: Au = f, u D(A)

Státnicová otázka 6, okruh 1

Vzdělávací materiál. vytvořený v projektu OP VK CZ.1.07/1.5.00/ Anotace. Diferenciální počet VY_32_INOVACE_M0216.

Úvod do optimalizace, metody hladké optimalizace

4EK311 Operační výzkum. 1. Úvod do operačního výzkumu

Matematika I (KMI/PMATE)

Fakt. Každou soustavu n lineárních ODR řádů n i lze eliminací převést ekvivalentně na jednu lineární ODR

4EK311 Operační výzkum. 2. Lineární programování

Nelineární rovnice. Numerické metody 6. května FJFI ČVUT v Praze

Funkce - pro třídu 1EB

Dnešní látka: Literatura: Kapitoly 3 a 4 ze skript Karel Rektorys: Matematika 43, ČVUT, Praha, Text přednášky na webové stránce přednášejícího.

Aplikace derivace a průběh funkce

Kapitola 4: Extrémy funkcí dvou proměnných 1/5

Kapitola 10: Diferenciální rovnice 1/14

Interpolace pomocí splajnu

prof. RNDr. Čestmír Burdík DrCs. prof. Ing. Edita Pelantová CSc. BI-ZMA ZS 2009/2010

Pavlína Matysová. 5. listopadu 2018

Typy příkladů na písemnou část zkoušky 2NU a vzorová řešení (doc. Martišek 2017)

Stručný přehled učiva

Globální extrémy (na kompaktní množině)

1. Obyčejné diferenciální rovnice

Matematická analýza III.

Kapitola 12: Soustavy diferenciálních rovnic 1. řádu

Kvadratickou funkcí se nazývá každá funkce, která je daná rovnicí. Definičním oborem kvadratické funkce je množina reálných čísel.

f ( x) = 5x 1 + 8x 2 MAX, 3x x ,

Význam a výpočet derivace funkce a její užití

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

3. Optimalizace pomocí nástroje Řešitel

Matematická analýza pro informatiky I.

Obyčejnými diferenciálními rovnicemi (ODR) budeme nazývat rovnice, ve kterých

verze 1.3 x j (a) g k 2. Platí-li vztahy v předchozím bodu a mají-li f, g 1,..., g s v a diferenciál K = f + j=1

AVDAT Nelineární regresní model

Přijímací zkouška na navazující magisterské studium 2014

Příklady na konvexnost a inflexní body. Funkce f (x) = x 3 9x. Derivace jsou f (x) = 3x 2 9 a f (x) = 6x. Funkce f je konvexní na intervalu (0, )

Diferenˇcní rovnice Diferenciální rovnice Matematika IV Matematika IV Program

Dodatek 2: Funkce dvou proměnných 1/9

PRŮBĚH FUNKCE JEDNÉ REÁLNÉ PROMĚNNÉ

Transkript:

Úvod do optimalizace Matematické metody pro ITS (11MAMY) Jan Přikryl (volně dle M.T. Heathe) 10. přednáška 11MAMY úterý 22. března 2016 verze: 2016-04-01 16:10 Obsah Optimalizační problém 1 Definice 1 Existence a jednoznačnost minima 3 Podmínky optimality 3 Jednorozměrná optimalizace 4 Hledání zlatým řezem 4 Vícerozměrná optimalizace 6 Přímé metody 6 Gradientní metody 6 Lineární programování 7 Tento text je doplněnou a počeštěnou verzí podkladů k přednáškám podle 6. kapitoly knihy Michaela T. Heathe Scientific Computing An Introductory Survey 1. Jde do jisté míry o experimentální pískoviště na odladění převodu textu prezentace vytvořené v LATEXové třídě beamer do textu vysázeného pomocí tufte-handout. Obsah je oproti prezentaci mírně rozšířen o poznámky. Bude se ještě v průběhu semestru měnit, kontrolujte si prosím čas sestavení v záhlaví tohoto souboru. 1 Michael T Heath. Scientific Computing An Introductory Survey. McGraw- Hill New York, 2002 Optimalizační problém todo Definice todo Definice 1 (Optimalizační problém). Mějme dánu funkci f : R n R a množinu S R n. Nalezněte x S takové, že f (x ) f (x) pro všechna x S.

2 x nazýváme optimum nebo minimum funkce f Stačí uvažovat minimalizaci: maximum f je minimum z f Účelová (cílová) funkce f je obvykle diferencovatelná a může být jak lineární, tak i nelinerání Přípustná množina (často také množina omezení) S je definována soustavou lineárních nebo nelineárních rovnic a nerovnic Body x S nazýváme přípustné body Pokud platí S = R n, jde o neomezený optimalizační problém Základní spojitý optimalizační problém lze zapsat jako min f (x) pokud g(x) = 0 a h(x) 0. Definice 2 (Lineární programování). Funkce f, g a h jsou lineární. Definice 3 (Nelineární programování). Alespoň jedna z funkcí f, g a h je nelineární. Minimalizujte hmotnost konstrukce při dodržení omezujících podmínek na její pevnost. Maximalizujte pevnost konstrukce při dodržení omezujících podmínek na její hmotnost. Minimalizujte náklady na potravu za podmínek minimálního příjmu určitých živin. Minimalizujte povrch válce daného objemu: min r,h f (r, h) = 2πr(r + h) za podmínky g(r, h) = πr 2 h V = 0, kde r a h jsou poloměr a výška válce a V je jeho požadovaný objem Definice 4 (Globální minimum). Bod x S je globálním minimem f, pokud f (x ) f (x) pro všechna x S. Definice 5 (Lokální minimum). Bod x S je lokálním minimem f, pokud f (x ) f (x) pro všechna přípustná x v okolí bodu x. Najít globální minimum či ověřit jeho existenci je obecně velmi obtížné Většina optimizačních metod je navržena na hledání lokálních minim, která mohou, ale nemusí být i globálním minimem lokální minimum globální minimum Obrázek 1: Globální a lokální minimum funkce Pokud hledáme globální minimum, můžeme zkusit několik široce rozprostřených starovacích bodů a ověřit, že konvergují k tomu samému výsledku Pro určité problémy (například pro lineární programování) je nalezení globálního optima výpočetně schůdné

3 Existence a jednoznačnost minima zde vynechán kus Heathe o koercivitě a level-sets Množina S R n je konvexní, pokud obsahuje i úsečku spojující libovolné dva body z této množiny. Funkce f : S R n R je konvexní na konvexní množině S, pokud její graf mezi dvěma libovolnými hodnotami z S leží na nebo pod úsečkou, spojující funkční hodnoty na koncových bodech úsečky. Jakékoliv lokální minimum konvexní funkce f na konvexní množině S R n je zároveň globálním minimem f na S Jakékoliv lokální minimum striktně konvexní funkce f na konvexní množině S R n je zároveň jednoznačným globálním minimem f na S Podmínky optimality Pro funkci jedné proměnné hledáme extrémy jako nulové body první derivace Obdobně u funkcí n proměnných hledáme kritické body, tedy řešení nelineární úlohy f (x) = 0, kde f (x) je gradientní vektor (prvky jsou f (x)/ x i ) Pokud je f : S R n R spojitě diferencovatelná, každý vnitřní bod x množiny S, na němž nabývá f lokálního minima, musí být kritickým bodem f Ne každý kritický bod je ale minimem: může jít i o maxima či sedlové body. Definice 6 (Hessián). Hessián funkce f : R n R je symetrická n n matice ( ) H f (x) = 2 f (x) = 2 f (x. x i x j Hessián umožňuje určit typ kritického bodu funkce: Je-li H f (x ) pozitivně definitní, pak x je minimem f, negativně definitní, pak x je maximem f, indefinitní, pak x je sedlový bod f, singulární, pak nastávají různé patologické situace. Pro minimalizaci funkce jedné proměnné potřebujeme uzávorkovat interval řešení analogicky k uzávorkování intervalu změny znaménka při řešení nelineárních rovnic

4 Definice 7 (Unimodalita). Reálná funkce f je unimodální na intervalu a, b v případě, že existuje jedinečné x a, b takové, že f (x ) je minimum f na a, b a f je striktně klesající pro x x a striktně rostoucí pro x x. Unimodalita umožňuje vyřazení části intervalu na základě vzorkování funkčních hodnot, analogicky s metodou půlení intervalu Mějme unimodální funkci f na a, b a v tomto intervalu dva body x 1 a x 2 takové, že x 1 < x 2 Porovnáním funkčních hodnot f (x 1 ) a f (x 2 ) můžeme vyřadit bud interval a, x 1 ) nebo x 2, b, minimum bude ležet ve zbylém podintervalu Při vhodné volbě stačí pro další iteraci jen jedno vyhodnocení funkce f, podobně jako u metody půlení itervalu Každý nový pár bodů se musí nacházet na pozicích, které jsou totožné k relativní délce celého intervalu Jednorozměrná optimalizace Hledání zlatým řezem Jednou z voleb je vybírat relativní pozice bodů takové, že body se nacházejí ve vzdálenostech τ a 1 τ od počátku, kde τ 2 = 1 τ a tedy τ = ( 5 1)/2 0,618 a 1 τ = 0,382 Podintervaly budou mít relativní délku τ původního intervalu a zbylý vnitřní bod bude na pozici bud τ nebo 1 τ vzhledem k délce podintervalu Pro další iteraci tedy stačí vyhodnotit pouze jednu funkční hodnotu f Hledání zlatým řezem je bezpečný způsob minimalizace, jeho rychlost konvergence je ale pouze lineární s C 0,618

5 a x 1 a x 2 x 1 x 2 b b

6 Vícerozměrná optimalizace Přímé metody Využívají pouze informace funkčních hodnotách účelové funkce a to pouze k jejich porovnání Pro minimalizace funkce f o n proměnných, Nelder-Meadova metoda začíná s n + 1 počátečními body a vytváří tak simplex v R n Následuje posun po přímce spojující bod s nejvyšší funkční hodnotou s centroidem ostatních bodů simplexu Tento nový bod nahadí původní nejhorší bod a celý proces se opakuje Přímé metody jsou vhodné pro nehladké funkce a pro malá n, ale drahé pro velká n Gradientní metody Diferenciální (gradientní) metody vyžadují určování hodnot účelové funkce a její první, respektive druhé derivace Necht je f : R n R reálná funkce n proměnných: V jakémkoliv bodě x s nenulovým gradientem ukazuje f (x) směrem k nižším hodnotám f Hodnota f (x) vlastně udává spádnici: funkční hodnoty f klesají ve směru negativního gradientu rychleji, než jakýmkoliv jiným směrem Definice 8 (Metoda největšího spádu). Od nástřelu x 0 pokračujeme iteracemi x k+1 = x k α k f (x k ), kde α k udává délku kroku získanou pomocí metody spádových směrů (angl. line-search). Definice 9 (Metoda spádových směrů). Známe-li směr sestupu f (x k ), hodnotu α k určíme jako a k = arg min α f (x k α f (x k )) což je jednorozměrná optimalizační úloha. Metoda největšího spádu je velmi spolehlivá (dokud je gradient nenulový) Je ale krátkozraká : zkoumá pouze nejbližší okolí bodu x k, iterace proto často oscilují a metoda konverguje pomalu. Zmínit sdružené gradienty Rychlost konvergence (o níž jsme se nebavili) je pouze lineární, každá iterace tedy přidává konstantní počet platných číslic.

7 Lineární programování Nejběžnější a jedena z nejdůležitějších optimalizačních úloh Definice 10 (Lineární programování). Najdi x = arg min c T x x za podmínky Ax = b a x 0, kde A R m n, m < n, b R m, c R n, x R n. Přípustná oblast je konvexní polyhedron v R n a minimum je v nějakém jeho vrcholu Řeší se pomocí simplexové metody: procházíme postupně všechny vrcholy, až najdeme minimum Simplexová metoda je spolehlivá a obvykle efektivní: je schopna řešit problémy s tisíci proměnných, v nejhorším případě ale může vyžadovat dobu exponenciálně úměrnou velikosti řešeného problému Metody vnitřního bodu vyvinuté pro LP v posledních letech mají v nejhorším případě polynomiální dobu řešení Tyto metody se pohybují přes vnitřek přípustné oblasti, neomezují se na vyšetřování pouze vrcholů polyhedronu Ačkoli metody vnitřního bodu mají značný praktický význam, simplexová metoda stále ve standardních balíčcích pro LP převládá její praktická účinnost je vynikající Příklad 1: Lineární program Uvažujme za podmínek x = arg min x c T x = 8x 1 11x 2 5x 1 + 4x 2 40, x 1 + 3x 2 12, x 1 0, x 2 0 Minimum x se musí nacházet v jednom z vrcholů přípustné oblasti, v tomto případě v bodě x 1 = 3,79, x 2 = 5.26, v němž má cílová funkce hodnotu f (x ) = 88,2. x 2 5x 1 + 4x 2 = 40 x x 1 + 3x 2 = 12 Reference [1] Michael T Heath. Scientific Computing An Introductory Survey. McGraw-Hill New York, 2002. x 1 0 22 44 66 88, Obrázek 2: Řešení úlohy z Příkladu 1