3. Přednáška: Line search

Podobné dokumenty
DRN: Kořeny funkce numericky

Základní spádové metody

Numerické řešení nelineárních rovnic

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Numerické metody optimalizace - úvod

Numerické řešení nelineárních rovnic

METODA PŮLENÍ INTERVALU (METODA BISEKCE) METODA PROSTÉ ITERACE NEWTONOVA METODA

4. Přednáška: Kvazi-Newtonovské metody:

LIMITA A SPOJITOST FUNKCE

M5170: Matematické programování

Numerické řešení nelineárních rovnic

17. Posloupnosti a řady funkcí

M5170: Matematické programování

PŘEDNÁŠKA 2 POSLOUPNOSTI

Numerická matematika 1


2. přednáška 8. října 2007

Matematika V. Dynamická optimalizace

Faster Gradient Descent Methods

10 Funkce více proměnných

Numerické metody a programování. Lekce 7

Funkce. Limita a spojitost

Numerické metody a programování. Lekce 8

Nelineární rovnice. Numerické metody 6. května FJFI ČVUT v Praze

Texty k přednáškám z MMAN3: 4. Funkce a zobrazení v euklidovských prostorech

Přednáška 11, 12. prosince Část 5: derivace funkce

Matematika 5 FSV UK, ZS Miroslav Zelený

Definice 1.1. Nechť je M množina. Funkci ρ : M M R nazveme metrikou, jestliže má následující vlastnosti:

Lineární klasifikátory

1 Posloupnosti a řady.

Hledání kořenů rovnic jedné reálné proměnné metoda sečen Michal Čihák 23. října 2012

Základy matematické analýzy

Kapitola 4: Průběh funkce 1/11

18 Fourierovy řady Úvod, základní pojmy

Dnešní látka: Literatura: Kapitoly 3 a 4 ze skript Karel Rektorys: Matematika 43, ČVUT, Praha, Text přednášky na webové stránce přednášejícího.

10 Určitý integrál Riemannův integrál. Definice. Konečnou posloupnost {x j } n j=0 nazýváme dělením intervalu [a,b], jestliže platí

Interpolace, ortogonální polynomy, Gaussova kvadratura

Typy příkladů na písemnou část zkoušky 2NU a vzorová řešení (doc. Martišek 2017)

K oddílu I.1 základní pojmy, normy, normované prostory

22 Základní vlastnosti distribucí

Kapitola 4: Průběh funkce 1/11

OPTIMALIZACE. (přehled metod)

Úvod do optimalizace Matematické metody pro ITS (11MAMY)

BAKALÁŘSKÁ PRÁCE. Numerické metody jednorozměrné minimalizace

Funkce v ıce promˇ enn ych Extr emy Pˇredn aˇska p at a 12.bˇrezna 2018

Co jsme udělali: Au = f, u D(A)

Aplikovaná numerická matematika

stránkách přednášejícího.

Nelineární optimalizace a numerické metody (MI NON)

Občas se používá značení f x (x 0, y 0 ), resp. f y (x 0, y 0 ). Parciální derivace f. rovnoběžného s osou y a z:

Newtonova metoda. 23. října 2012

Limita posloupnosti, limita funkce, spojitost. May 26, 2018

Hledání extrémů funkcí

f(c) = 0. cn pro f(c n ) > 0 b n pro f(c n ) < 0

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Eva Havelková. Katedra numerické matematiky

l, l 2, l 3, l 4, ω 21 = konst. Proved te kinematické řešení zadaného čtyřkloubového mechanismu, tj. analyticky

TEORIE MÍRY V některých předchozích kapitolách jste se setkali s měřením velikostí množin a víte, jaké byly těžkosti s měřením množin i na reálné ose.

Definice globální minimum (absolutní minimum) v bodě A D f, jestliže X D f

Drsná matematika III 2. přednáška Funkce více proměnných: Aproximace vyšších rádů, Taylorova věta, inverzní zobrazení

1 Množiny, výroky a číselné obory

To je samozřejmě základní pojem konvergence, ale v mnoha případech je příliš obecný a nestačí na dokazování některých užitečných tvrzení.

III. MKP vlastní kmitání

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Obraz matematický objekt. Spojitý obraz f c : (Ω c R 2 ) R

Posloupnosti a řady. 28. listopadu 2015

Přednáška 6, 6. listopadu 2013

Otázky k ústní zkoušce, přehled témat A. Číselné řady

Kapitola 1. Úvod. 1.1 Značení. 1.2 Výroky - opakování. N... přirozená čísla (1, 2, 3,...). Q... racionální čísla ( p, kde p Z a q N) R...

Matematika I 12a Euklidovská geometrie

1 Topologie roviny a prostoru

Lineární algebra : Změna báze

16 Fourierovy řady Úvod, základní pojmy

6. Určitý integrál a jeho výpočet, aplikace

Matematika I (KX001) Užití derivace v geometrii, ve fyzice 3. října f (x 0 ) (x x 0) Je-li f (x 0 ) = 0, tečna: x = 3, normála: y = 0

Diferenˇcní rovnice Diferenciální rovnice Matematika IV Matematika IV Program

které charakterizují danou fyzikální situaci. souvislostí). Může být formulován jako soustava rovnic a nerovnic.

Lineární algebra : Metrická geometrie

Numerické metody řešení nelineárních rovnic

Komplexní analýza. Holomorfní funkce. Martin Bohata. Katedra matematiky FEL ČVUT v Praze

1 Přesnost metody konečných prvků

Drsná matematika III 1. přednáška Funkce více proměnných: křivky, směrové derivace, diferenciál

- funkce, které integrujete aproximujte jejich Taylorovými řadami a ty následně zintegrujte. V obou případech vyzkoušejte Taylorovy řady

Základy matematiky pro FEK

Michal Bulant. Masarykova univerzita Fakulta informatiky

Posloupnosti a jejich konvergence

Přijímací zkouška na navazující magisterské studium 2018

Úvod do optimalizace, metody hladké optimalizace

7.1 Extrémy a monotonie

Dnešní látka Variačně formulované okrajové úlohy zúplnění prostoru funkcí. Lineární zobrazení.

METODY OPTIMALIZACE ZDENĚK DOSTÁL, PETR BEREMLIJSKI

Matematika 4 FSV UK, LS Miroslav Zelený

Z transformace. Definice. Z transformací komplexní posloupnosti f = { } f n z n, (1)

Důvodů proč se zabývat numerickou matematikou je více. Ze základní školy si odnášíme znalost, že číslo

Přijímací zkouška na navazující magisterské studium 2018

IX. Vyšetřování průběhu funkce

Drsná matematika III 2. přednáška Funkce více proměnných: Aproximace vyšších rádů, Taylorova věta, inverzní zobrazení

Princip řešení soustavy rovnic

Šárka Došlá. Matematicko-fyzikální fakulta Univerzita Karlova v Praze. Bimodální rozdělení. Šárka Došlá. Motivace. Základní pojmy

Numerické řešení diferenciálních rovnic

Algoritmy numerické optimalizace. Michal Kočvara

Transkript:

Úloha: 3. Přednáška: Line search min f(x), x R n kde x R n, n 1 a f : R n R je dvakrát spojitě diferencovatelná. Iterační algoritmy: Začínám v x 0 a vytvářím posloupnost iterací {x k } k=0, tak, aby minimum bylo aproximováno s dostatečnou přesností, ideálně končila v přesném řešení. K posunutí z x k do x k+1, aby f(x k+1 ) < f(x k ) mohu použít informace o x 0,..., x k 1 a jejich funkčních hodnotách. 2 základní strategie, jak se posunout z x k do x k+1 : Line search, trust region. Line search algoritmus: Dáno x 0, interval (a, b), ε atd. a pro k = 0, 1, 2,... : 1) najdi směr p k R n - spádový směr, 2) najdi α k tak, aby x k + α k p k bylo lepší než x k (ideálně minimální - exaktní line search, dostatečně malé - aproximace), 3) polož x k+1 = x k + α k p k. Priklad3.m ad 1) viz další přednášky, ad 2) hledání minima jednodimenzionální funkce φ(α) = f(x k + αp k ), tj. řeším úlohu: min φ(α). α>0 Jednodimenzionální minimalizace: Definice: Unimodální funkce Funkce φ : R R je unimodální na intervalu a, b, jestliže existuje c (a, b) takové, že φ je klesající na a, c a rostoucí na c, b. Věta: Pozice minima Nechť φ je unimodální v a, b a nabývá svého minima v α a, b. Pak pro libovolné x a y, kde a x < y b platí následující tvrzení: 1

Je-li φ(x) < φ(y), pak α < y. Je-li φ(x) > φ(y), pak α > x. Je-li φ(x) = φ(y), pak x < α < y. Algoritmus: Za předpokladu unimodální funkce φ a pomocí výše uvedené věty generuji posloupnost zmenšujících se intervalů obsahujících řešení α (intervaly neurčitosti): a, b = I 0 I 1... I k 1 I k = a k, b k, k b k a k značí délku k-tého intervalu. Požaduji co nejmenší vyhodnocování funkce φ, co největší redukci intervalů, jednoduchost. Metody: Metoda bisekce (krácení na poloviny, jednoduché, drahé - hodně vyhodnocování φ). Priklady3 bisekce.m Fibonacciho metoda (optimální, krácení v poměru fibonacciho čísel, když chceme zpřesnit musíme začít od začátku). Fibonacciho posloupnost: F 0 = F 1 = 1, F k = F k 1 + F k 2, k = 2...., N. Priklady3 fibonacci.m Metoda zlatého řezu (optimální). Zafixujeme zkracování intervalu na jedné hodnotě: F ξ = lim N 1 N F N, platí ξ = 5 1 - zlatý řez. 2 Priklady3 zlatyrez.m Newtonova metoda: funkce φ musí být navíc hladká, aproximace kvadratickou funkcí. Priklady3 newton.m Testování dostatečného poklesu. Dostatečný pokles: Dilema přesnost x výpočetní čas Použití minimalizační metody (viz výše), ale zastavím hledání řešení, pokud interval neurčitosti splňuje podmínku: α ᾱ cᾱ, kde α je přesné řešení, ᾱ je aktuální řešení, α ᾱ délka intervalu neurčitosti. Spokojím se s dostatečným poklesem. 2

Přímka udávající pokles: x k, p k spádový směr φ (0) = grad T f(x k )p k < 0. Chci zvolit α tak, aby φ(α) f(x k + αp k ) dostatečně pokleslo a α nebylo ani malé ani velké. Přímka udávající pokles: pro dané ε (0, 1): l(α) φ(0) + εφ (0)α. Pro všechna α taková, že φ(α) < l(α) platí f(x k + αp k ) = φ(α) < φ(0) = f(x k ). Armijův test (podmínka): Pokud bude α malé i pokles může být malý. Volba tak, aby například dvojnásobné (desetinásobné) α už nesplnilo podmínku φ(α) < l(α), tj. zvol η (η = 2) a najdi α tak, aby Pseudo-algoritmus: Start: volím ε (v praxi volíme malé, 10 4 ), η, α... φ(α) φ(0) + εφ (0)α (1) φ(ηα) > φ(0) + εφ (0)α. (2) Pokud je splněna (1), prováděj α = ηα dokud není splněna (2). Pokud není splněna (1), prováděj α = α, dokud není splněna (1). η Interval přípustných hodnot α nemusí obsahovat minimum funkce φ(α). Priklad3 pokles.m Goldsteinův test (podmínka): Zvolím ε ( 0, 1 2) tak, aby φ(α) φ(0) + εφ (0)α. (3) Aby α nebylo příliš malé, musí ležet nad jinou přímkou, tj. φ(α) φ(0) + (1 ε)φ (0)α. (4) Interval přípustných hodnot α nemusí obsahovat minimum funkce φ(α). Priklad3 goldstein.m 3

Wolfeho test (podmínka): Zvolím ε ( 0, 1 2) tak, aby φ(α) φ(0) + εφ (0)α. (5) Dám požadavek na sklon: pokud jsem blízko minima φ (α) < φ (0). Wolfeho podmínka: (5) a φ(α) (1 ε)φ (0). (6) Silná Wolfeho podmínka: (5) a Nemusím se omezovat jen jedním ε. Alternativa: pro 0 < c 1 < c 2 < 1 φ(α) (1 ε) φ (0). (7) φ(α) φ(0) + c 1 φ (0)α, φ (α) c 2 φ (0), φ(α) c 2 φ (0). Wolfeho test zaručí jak dostatečný pokles φ(α), tak dostatečný nárůst φ (α) vzhledem k α = 0. Priklad3 wolfe.m Konvergence algoritmů typu Line-search: Body x k nalezené Line-search algoritmem obecně nemusí konvergovat k přesnému řešení x. Konvergenci lze chápat v různém smyslu: lim x k = x nebo lim f(x k ) = 0. k k p k f k f k p k, θ k... úhel svírající zvolený spádový směr a směr nej- Označme cos θ k = většího spádu. Lipchitzovská spojitost f(x) na Ω: existuje konstanta L > 0 taková, že f(x) f(y) L x y, x, y Ω. Vrstevnicová oblast Γ f(x0 ) {x : f(x) f(x 0 )}. 4

Věta: Nechť x 0 R n je počáteční přiblížení a nechť f C 1 (Ω), kde Ω je otevřená množina obsahující vrstevnicovou oblast Γ f(x0 ). Dále nechť f je Lipschitzovsky spojitý na Ω. Uvažujme algoritmus Line-search, tj. iterace x k+1 = x k + α k p k, kde p k je spádový směr a α k splňuje Wolfeho podmínky. Potom cos 2 (θ k ) f(x k ) 2 < a tato podmínka implikuje k 0 cos 2 (θ k ) f(x k ) 2 0 pro k. Definice: Řekneme, že konvergentní posloupnost {x k } konverguje k x rychlostí řádu p, pokud existují čísla 0 < c < 1 a k 0 > 0 taková, že platí ɛ k+1 ɛ k p c, k k 0. Kde ɛ k x k x. Pro p = 1 mluvíme o lineární rychlosti konvergence, pro p = 2 mluvíme o kvadratické rychlosti konvergence. Pokud platí ɛ k+1 a k, ɛ k kde {a k } je posloupnost nezáporných čísel, a k 0 + pro k, hovoříme o superlineární konvergenci. 5