Základní spádové metody

Podobné dokumenty
Numerické metody optimalizace - úvod

Nelineární optimalizace a numerické metody (MI NON)

Faster Gradient Descent Methods

3. Přednáška: Line search

Matematika V. Dynamická optimalizace

4. Přednáška: Kvazi-Newtonovské metody:

stránkách přednášejícího.

Dnešní látka Opakování: normy vektorů a matic, podmíněnost matic Jacobiova iterační metoda Gaussova-Seidelova iterační metoda

10 Funkce více proměnných

Arnoldiho a Lanczosova metoda

Kapitola 5. SLAR - gradientní metody

Matematika 5 FSV UK, ZS Miroslav Zelený

OPTIMALIZACE. (přehled metod)

PROSTORY SE SKALÁRNÍM SOUČINEM. Definice Nechť L je lineární vektorový prostor nad R. Zobrazení L L R splňující vlastnosti

Primitivní funkce a Riemann uv integrál Lineární algebra Taylor uv polynom Extrémy funkcí více prom ˇenných Matematika III Matematika III Program

Úvod do optimalizace, metody hladké optimalizace

Funkce v ıce promˇ enn ych Extr emy Pˇredn aˇska p at a 12.bˇrezna 2018

Numerické metody a programování. Lekce 8

Učební texty k státní bakalářské zkoušce Matematika Skalární součin. študenti MFF 15. augusta 2008

9. přednáška 26. listopadu f(a)h < 0 a pro h (0, δ) máme f(a 1 + h, a 2,..., a m ) f(a) > 1 2 x 1

Lineární programování

Co jsme udělali: Au = f, u D(A)

Matematická analýza pro informatiky I. Extrémy funkcí více proměnných

Princip řešení soustavy rovnic

Dnešní látka: Literatura: Kapitoly 3 a 4 ze skript Karel Rektorys: Matematika 43, ČVUT, Praha, Text přednášky na webové stránce přednášejícího.

Metoda sdružených gradientů

2 Vektorové normy. Základy numerické matematiky - NMNM201. Definice 1 (Norma). Norma je funkcionál splňující pro libovolné vektory x a y a pro

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Úlohy nejmenších čtverců

Matematická analýza pro informatiky I.

Hledání extrémů funkcí

Připomenutí co je to soustava lineárních rovnic

Michal Bulant. Masarykova univerzita Fakulta informatiky

Obsah. Matematika. Obsah. Ljapunovova metoda. Volba LF

5. Lokální, vázané a globální extrémy

Matice. Předpokládejme, že A = (a ij ) je matice typu m n: diagonálou jsou rovny nule.

Princip gradientních optimalizačních metod

Literatura: Kapitoly 3, 4 a 2 d) ze skript Karel Rektorys: Matematika 43, ČVUT, Praha, Text přednášky na webové stránce přednášejícího.

Úvod do optimalizace Matematické metody pro ITS (11MAMY)

Definice 1.1. Nechť je M množina. Funkci ρ : M M R nazveme metrikou, jestliže má následující vlastnosti:

Vlastní (charakteristická) čísla a vlastní (charakteristické) Pro zadanou čtvercovou matici A budeme řešit maticovou

Kapitola 4: Extrémy funkcí dvou proměnných 1/5

7 Konvexní množiny. min c T x. při splnění tzv. podmínek přípustnosti, tj. x = vyhovuje podmínkám: A x = b a x i 0 pro každé i n.

Aplikovaná numerická matematika

METODY OPTIMALIZACE ZDENĚK DOSTÁL, PETR BEREMLIJSKI

EUKLIDOVSKÉ PROSTORY

Typy příkladů na písemnou část zkoušky 2NU a vzorová řešení (doc. Martišek 2017)

11. Skalární součin a ortogonalita p. 1/16

Symetrické a kvadratické formy

Četba: Texty o lineární algebře (odkazy na webových stránkách přednášejícího).

ALGEBRA. Téma 5: Vektorové prostory

Co je obsahem numerických metod?

Úvod do lineární algebry

Četba: Texty o lineární algebře (odkazy na webových stránkách přednášejícího).

12. Funkce více proměnných

M5170: Matematické programování

AVDAT Nelineární regresní model

Dnešní látka Variačně formulované okrajové úlohy zúplnění prostoru funkcí. Lineární zobrazení.

Aplikovaná numerická matematika - ANM

EXTRÉMY FUNKCÍ VÍCE PROMĚNNÝCH

ZADÁNÍ ZKOUŠKOVÉ PÍSEMNÉ PRÁCE Z PŘEDMĚTU LINEÁRNÍ ALGEBRA PRO IT. Verze 1.1A

M5170: Matematické programování

f ( x) = 5x 1 + 8x 2 MAX, 3x x ,

Lineární algebra : Lineární (ne)závislost

Četba: Texty o lineární algebře (odkazy na webových stránkách přednášejícího).

které charakterizují danou fyzikální situaci. souvislostí). Může být formulován jako soustava rovnic a nerovnic.

Uzavřené a otevřené množiny

Problém lineární komplementarity a kvadratické programování

Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru. Kvadratická forma v n proměnných je tak polynom n proměnných s

Hledáme lokální extrémy funkce vzhledem k množině, která je popsána jednou či několika rovnicemi, vazebními podmínkami. Pokud jsou podmínky

Diferenˇcní rovnice Diferenciální rovnice Matematika IV Matematika IV Program

FP - SEMINÁŘ Z NUMERICKÉ MATEMATIKY. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

)(x 2 + 3x + 4),

DERIVACE FUKNCÍ VÍCE PROMĚNNÝCH

Literatura: Kapitola 2 d) ze skript Karel Rektorys: Matematika 43, ČVUT, Praha, Text přednášky na webové stránce přednášejícího.

Učební texty k státní bakalářské zkoušce Matematika Základy teorie funkcí více proměnných. študenti MFF 15. augusta 2008

Soustavy lineárních rovnic-numerické řešení. October 2, 2008

15 Maticový a vektorový počet II

SOUSTAVY LINEÁRNÍCH ALGEBRAICKÝCH ROVNIC

Kapitola 12: Soustavy diferenciálních rovnic 1. řádu

Program SMP pro kombinované studium

Přednáška 11, 12. prosince Část 5: derivace funkce

1 0 0 u 22 u 23 l 31. l u11

Pozn. 1. Při návrhu aproximace bychom měli aproximační funkci vybírat tak, aby vektory ϕ (i) byly lineárně

Základy maticového počtu Matice, determinant, definitnost

Zdrojem většiny příkladů je sbírka úloh 1. cvičení ( ) 2. cvičení ( )

Státnicová otázka 6, okruh 1

2. Schurova věta. Petr Tichý. 3. října 2012

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

DRN: Kořeny funkce numericky

Singulární rozklad. Petr Tichý. 31. října 2013

Podobnostní transformace

Lineární klasifikátory

IX. Vyšetřování průběhu funkce

Matematika pro informatiky

1 Báze a dimenze vektorového prostoru 1

Průvodce studiem. do bodu B se snažíme najít nejkratší cestu. Ve firmách je snaha minimalizovat

Obsah. Lineární rovnice. Definice 7.9. a i x i = a 1 x a n x n = b,

METRICKÉ A NORMOVANÉ PROSTORY

18 Fourierovy řady Úvod, základní pojmy

Transkript:

Základní spádové metody Petr Tichý 23. října 2013 1

Metody typu line search Problém Idea metod min f(x), f : x R Rn R. n Dána počáteční aproximace x 0. Iterační proces (krok k): (a) zvol směr d k, (b) urči α k tak, aby f(x k + α k d k ) bylo dostatečně malé, (c) polož x k+1 = x k + α k d k. Definice d k R n nazveme spádovým směrem, pokud platí g T k d k < 0. 2

Metoda největšího spádu Definice Nejstarší a nejznámější metoda, důležitá z teoretického hlediska, motivace pro pokročilejší metody. Nechť f C 1 (R n ). Metoda největšího spádu je definována rekurencí x k+1 = x k α k g k, kde α k je nezáporný skalár takový, že minimalizuje funkci φ(α) f(x k αg k ), g k f(x k ). Směrový vektor d k je tedy volen jako d k = g k. 4

Minimalizace kvadratického funkcionálu Vyšetřujme konvergenci pro kvadratický problém f(x) 1 2 xt Ax x T b, kde A je symetrická, pozitivně definitní matice. Hessián f pozitivně definitní všude v R n. f ostře konvexní. Jednoznačné globální minimum ve stacionárním bodě. Ax = b. 5

Kvadratický funkcionál Různé zápisy Ukázali jsme na cvičení f(x) = 1 2 (x x ) T A(x x ) }{{} E(x) 1 2 (x ) T Ax, f(x) a E(x) se liší pouze o konstantu nabývají minima ve stejném bodě, mají stejný gradient g(x) = Ax b. A je pozitivně definitní definuje A-normu x A (x T Ax) 1/2. Platí E(x) = 1 2 x x 2 A. Závěr: Minimalizace f(x) je ekvivalentní minimalizaci x x 2 A. 6

Metoda největšího spádu pro kvadratickou funkci Na cvičení jsme ukázali, že pro kvadratickou funkci je minima dosaženo pro φ(α) = f(x k + αd k ) α k = gt k d k d T k Ad. k Metoda největšího spádu pro kvadratickou f je dána vztahy x k+1 = x k α k g k, g k = Ax k b a α k = gt k g k gk T Ag. k 7

Metoda největšího spádu Typický obrázek konvergence, zig-zag chování 8

Metoda největšího spádu Konvergence Lemma Za výše uvedených předpokladů platí ( (gk T E(x k+1 ) = 1 g k) 2 ) (gk T Ag k)(gk T E(x k ). A 1 g k ) Lemma (Kantorovičova nerovnost) Nechť A R n n je symetrická, pozitivně definitní matice. Potom pro každý nenulový vektor x platí nerovnost (x T x) 2 (x T Ax)(x T A 1 x) 4 λ min λ max (λ min + λ max ) 2. 9

Metoda největšího spádu Konvergenční věta Věta Pro každé x 0 R konverguje metoda největšího spádu pro kvadratický funkcionál f(x) k jednoznačnému minimu x. Pro chybu E(x) platí v k-tém kroku vztah E(x k+1 ) ( ) λmax λ 2 min E(x k ). λ max + λ min 10

Metoda největšího spádu Nekvadratický případ Metodu největšího spádu lze použít i na nekvadratickou úlohu: musíme řešit problém jak spočíst gradient, musíme řešit problém minimalizace v daném směru. Ne vždy konverguje. Některé vlastnosti se přenášejí z kvadratického případu, např. Rychlost konvergence Nechť f C 2 (R n ) má v x bod lokálního minima, nechť H(x ) je symetrická pozitivně definitní matice. Pokud {x k } konverguje k x, potom {f(x k )} konverguje lineárně k f(x ) s konvergenčním faktorem ne větším než ( ) λmax λ 2 min, λ max + λ min kde λ max a λ min jsou největší a nejmenší vlastní číslo H(x ). 11

Newtonova metoda Idea: Na základě Taylorova rozvoje aproximovat f pomocí kvadratického funkcionálu a určit jeho přesný bod minima. Matematická formulace: f(x) q(x), q(x) f(x k ) + g T k (x x k ) + 1 2 (x x k) T H(x k )(x x k ). Gradient q(x), q(x) = g k + H(x k )x H(x k )x k. q(x) = 0 x = [H(x k )] 1 (H(x k )x k g k ). Definujme ( čistá Newtonova metoda) x k+1 x k [H(x k )] 1 g k. Pokud jsme blízko ostrého lokálního minima, H(x k ) je pozitivně definitní, metoda je dobře definována a konverguje kvadraticky. 13

Newtonova metoda Praktické úpravy Zavedení délky kroku α k : x k+1 x k α k [H(x k )] 1 g k, kde α k minimalizuje f v daném směru. Jsme-li blízko řešení, pak zřejmě α k 1. Zavedení α k zamezuje případnému růstu, způsobenému přítomností nekvadratických členů v f. Obecněji lze definovat třídu algoritmů používající vztahy x k+1 x k α k M k g k, kde M k je čtvercová matice, α k je kladný hledací parametr. Metoda největšího spádu volí M k = I, Newtonova metoda volí M k = [H(x k )] 1. 14

Newtonova metoda Praktické úpravy Směr d k = M k g k, je spádový, pokud platí gk T d k < 0, tj. gk T M k g k > 0. Volíme-li M k pozitivně definitní, je podmínka splněna. H(x k ) nemusí být pozitivně definitní M k lze volit jako M k = [β k I + H(x k )] 1, kde β k > 0 zajistí pozitivní definitnost. Jde o kompromis mezi Metodou největšího spádu (β k velmi velké), Newtonovou metodou (β k = 0). 15

Metoda cyklického souřadnicového spádu Jednoduchá implementace, obecně velmi pomalá konvergence. Nechť f C 1 (R n ). Provedeme postupně n minimalizací ve směru souřadnicových os, tj. Jinak řečeno, volíme, min x k f(x 1, x 2,..., x n ), k = 1,..., n. d k = e k = [0,..., 0, 1, 0,..., 0] T, Po n jednorozměrných minimalizacích získáme x k+1. Opakujeme, dokud není splněno zastavovací kritérium. 17