algoritmus»postup06«p e t r B y c z a n s k i Ú s t a v g e o n i k y A V

Podobné dokumenty
9. přednáška 26. listopadu f(a)h < 0 a pro h (0, δ) máme f(a 1 + h, a 2,..., a m ) f(a) > 1 2 x 1

ekologie Pavel Fibich rovnice rovnice Pavel Fibich Shrnutí Literatura

Funkce v ıce promˇ enn ych Extr emy Pˇredn aˇska p at a 12.bˇrezna 2018

Řešení 1b Máme najít body, v nichž má funkce (, ) vázané extrémy, případně vázané lokální extrémy s podmínkou (, )=0, je-li: (, )= +,

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

5. Lokální, vázané a globální extrémy

Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012

Diferenciální rovnice 1

MATEMATIKA III. Olga Majlingová. Učební text pro prezenční studium. Předběžná verze

Vlastní (charakteristická) čísla a vlastní (charakteristické) Pro zadanou čtvercovou matici A budeme řešit maticovou

Extrémy funkce dvou proměnných

Numerická matematika 1

Definice globální minimum (absolutní minimum) v bodě A D f, jestliže X D f

Parciální diferenciální rovnice

1. DIFERENCIÁLNÍ POČET FUNKCE DVOU PROMĚNNÝCH

Pozn. 1. Při návrhu aproximace bychom měli aproximační funkci vybírat tak, aby vektory ϕ (i) byly lineárně

Funkce dvou a více proměnných

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

I. Diferenciální rovnice. 3. Rovnici y = x+y+1. převeďte vhodnou transformací na rovnici homogenní (vzniklou

Matematická analýza pro informatiky I.

10. cvičení - LS 2017

POŽADAVKY K SOUBORNÉ ZKOUŠCE Z MATEMATIKY

Obsah Obyčejné diferenciální rovnice

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Matematická analýza pro informatiky I. Extrémy funkcí více proměnných

Nalezněte obecné řešení diferenciální rovnice (pomocí separace proměnných) a řešení Cauchyho úlohy: =, 0 = 1 = 1. ln = +,

Soustavy nelineárních rovnic pomocí systému Maple. Newtonova metoda.

MATEMATIKA II V PŘÍKLADECH

Globální matice konstrukce

Metoda konečných prvků Charakteristika metody (výuková prezentace pro 1. ročník navazujícího studijního oboru Geotechnika)

Matematická analýza III.

Čebyševovy aproximace

Definice Tečna paraboly je přímka, která má s parabolou jediný společný bod,

Numerické metody a programování. Lekce 8

Matematika I A ukázkový test 1 pro 2011/2012. x + y + 3z = 1 (2a 1)x + (a + 1)y + z = 1 a

Základní spádové metody

15. KubickÈ rovnice a rovnice vyööìho stupnï

Co je obsahem numerických metod?

Otázku, kterými body prochází větev implicitní funkce řeší následující věta.

Drsná matematika III 6. přednáška Obyčejné diferenciální rovnice vyšších řádů, Eulerovo přibližné řešení a poznámky o odhadech chyb

6. DIFERENCIÁLNÍ POČET FUNKCE VÍCE PROMĚNNÝCH

9.5. Soustavy diferenciálních rovnic

ODR metody Runge-Kutta

Newtonova metoda. 23. října 2012

Kombinatorická minimalizace

Věta 12.3 : Věta 12.4 (princip superpozice) : [MA1-18:P12.7] rovnice typu y (n) + p n 1 (x)y (n 1) p 1 (x)y + p 0 (x)y = q(x) (6)

Arnoldiho a Lanczosova metoda

Nyní využijeme slovník Laplaceovy transformace pro derivaci a přímé hodnoty a dostaneme běžnou algebraickou rovnici. ! 2 "

Jméno autora: Mgr. Zdeněk Chalupský Datum vytvoření: Číslo DUM: VY_32_INOVACE_16_FY_A

Aplikovaná numerická matematika

Průvodce studiem. do bodu B se snažíme najít nejkratší cestu. Ve firmách je snaha minimalizovat

Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory

Učební texty k státní bakalářské zkoušce Matematika Diferenciální rovnice. študenti MFF 15. augusta 2008

Budeme hledat řešení y(x) okrajové úlohy pro diferenciální rovnici druhého řádu v samoadjungovaném tvaru na intervalu a, b : 2 ) y i p i+ 1

Matematika I A ukázkový test 1 pro 2014/2015

Diferenciální počet - II. část (Taylorův polynom, L Hospitalovo pravidlo, extrémy

Matematika 5 FSV UK, ZS Miroslav Zelený

CVIČNÝ TEST 22. OBSAH I. Cvičný test 2. Mgr. Tomáš Kotler. II. Autorské řešení 6 III. Klíč 13 IV. Záznamový list 15

verze 1.4 Ekvivalentní podmínkou pro stacionární bod je, že totální diferenciál je nulový

Univerzita Karlova v Praze Pedagogická fakulta

Bézierovy křivky Bohumír Bastl KMA/GPM Geometrické a počítačové modelování Bézierovy křivky GPM 1 / 26

ANALÝZA A KLASIFIKACE DAT

verze 1.3 x j (a) g k 2. Platí-li vztahy v předchozím bodu a mají-li f, g 1,..., g s v a diferenciál K = f + j=1

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

EXTRÉMY FUNKCÍ VÍCE PROMĚNNÝCH

8.1. Separovatelné rovnice

Numerické metody optimalizace - úvod

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice

Nejdřív spočítáme jeden příklad na variaci konstant pro lineární diferenciální rovnici 2. řádu s kostantními koeficienty. y + y = 4 sin t.

7.1 Extrémy a monotonie

1 1 x 2. Jedná se o diferenciální rovnici se separovanými proměnnými, která má smysl pro x ±1 a

Vyšetřování průběhu funkce pomocí programu MatLab. 1. Co budeme potřebovat?

Důvodů proč se zabývat numerickou matematikou je více. Ze základní školy si odnášíme znalost, že číslo

Hledáme lokální extrémy funkce vzhledem k množině, která je popsána jednou či několika rovnicemi, vazebními podmínkami. Pokud jsou podmínky

Problém lineární komplementarity a kvadratické programování

Literatura: Kapitola 2 d) ze skript Karel Rektorys: Matematika 43, ČVUT, Praha, Text přednášky na webové stránce přednášejícího.

NUMERICKÉ METODY. Problematika num. řešení úloh, chyby, podmíněnost, stabilita algoritmů. Aproximace funkcí.

Drsná matematika III 2. přednáška Funkce více proměnných: Aproximace vyšších rádů, Taylorova věta, inverzní zobrazení

DEFINICE,VĚTYADŮKAZYKÚSTNÍZKOUŠCEZMAT.ANALÝZY Ib

1/15. Kapitola 12: Soustavy diferenciálních rovnic 1. řádu

CZ 1.07/1.1.32/

y = 2x2 + 10xy + 5. (a) = 7. y Úloha 2.: Určete rovnici tečné roviny a normály ke grafu funkce f = f(x, y) v bodě (a, f(a)). f(x, y) = x, a = (1, 1).

PŘÍKLADY K MATEMATICE 2

Úvod do analytické mechaniky

CITLIVOSTNÍ ANALÝZA DYNAMICKÝCH SYSTÉMŮ I

Studijní text pro obor G+K Katedra matematiky Fakulta stavební ROVNICE. Doc. RNDr. Milada Kočandrlová, CSc.

Úloha - rozpoznávání číslic

Interpolace pomocí splajnu

Diferenciální rovnice 3

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

Diferenciál funkce dvou proměnných. Má-li funkce f = f(x, y) spojité parciální derivace v bodě a, pak lineární formu (funkci)

ANOTACE vytvořených/inovovaných materiálů

Q(y) dy = P(x) dx + C.

1 Funkce dvou a tří proměnných

Úvod do optimalizace, metody hladké optimalizace

Obyčejnými diferenciálními rovnicemi (ODR) budeme nazývat rovnice, ve kterých

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Maturitní otázky z předmětu MATEMATIKA

Příklad 1 ŘEŠENÉ PŘÍKLADY Z M1B ČÁST 2. Určete a načrtněte definiční obory funkcí více proměnných: a) (, ) = b) (, ) = 3. c) (, ) = d) (, ) =

Drsná matematika III 2. přednáška Funkce více proměnných: Aproximace vyšších rádů, Taylorova věta, inverzní zobrazení

Transkript:

Hledání lokálního maxima funkce algoritmus»postup06«p e t r B y c z a n s k i Ú s t a v g e o n i k y A V Č R Abstrakt : Lokální maximum diferencovatelné funkce je hledáno postupnou změnou argumentu. V okolí každého postupového bodu je funkční pr ůběh aproximován pouze několika členy Taylorova rozvoje. Změna argumentu určená na základě aproximativního pr ůběhu je primárně omezena zachováním jistého stupně platnosti aproximace! Toto je jádrem prezentovaného algoritmu. Velikost oblasti použitelnosti aproximace je určována jediným řídicím parametrem. Velmi jednoduchý algoritmus»postup06«je určen pro nalezení argumentu lokálního maxima funkce F, když platí (A) F : D E n E 1 má spojité první parciální derivace (B) je zadán výchozí bod X, o němž je předpokládáno, že se z něj dá spojitou změnou dosáhnout lokálního maxima. Principiální myšlenkové řešení je : Začínáme v zadaném bodě. Provádíme myšlené infinitezimální změny úměrné gradientu funkce. Pohybujeme se tím po teoretické křivce směřující do lokálního maxima resp. do bodu vzr ůstu funkčních hodnot nade všechny meze. Tento cílový bod nemusíme dosáhnout, když se zastavíme ve stacionárním bodě nebo narazíme na hranici definičního oboru. Předkládaný algoritmus je diskrétní analogií uvedeného myšlenkového postupu. V okolí každého postupového bodu nahradíme přesný pr ůběh funkce F pouze prvními dvěma členy Taylorova rozvoje. Lineární aproximační funkce určuje jistou postupovou polopřímku. Po ní se pohybujeme nejvýše do okamžiku, kdy bychom vyjeli.... z oblasti alespoň přibližné platnosti aproximace.. z definičního oboru Díky první podmínce je podstatná část změny zachycena v aktuální aproximaci. V následujícím postupovém bodě proto určitě dojde ke zvětšení funkční hodnoty a určitě se příliš neodchýlíme od teoretické postupové křivky vedoucí z předchozího postupového bodu do cílového bodu. Posloupnost postupových krok ů ukončíme při dosažení téměř nulové velikosti gradientu funkce resp. při směřování mimo definiční obor. Míra platnosti aproximace je zadána jediným řídicím parametrem.

Použité označování : i F označuje první parciální derivaci F podle i.-té složky argumentu. Po vynechání indexu označuje F vektor tvořený prvními parciálními derivacemi. Přesný myšlenkový postup Pro enumeraci souvislé změny si zavedeme číselný parametr t s nulovou hodnotou odpovídající začátku. Teoretická postupová křivka x (t) splňuje d dt x (0) = X (1a) x (t) = F ( x (t) ) (1b) Rovnice (1b) zajištuje "co nejrychlejší" postup k cíli. Fakticky nás nezajímá celé řešení, ale pouze koncový bod! Skutečný diskrétní postup Soustavu diferenciálních rovnic (1) nebudeme řešit přesně. Z výchozího bodu X se začneme pohybovat podél tečné přímky. Při jistém odklonu od teoretické křivky (1) první postupový krok ukončíme. Dostáváme se tím do jistého postupového bodu, který bude obecně odlišný od cílového bodu. V tomto novém postupovém bodě celou úvahu zopakujeme. Vede z něj trochu jiná teoretická křivka k požadovanému cíli. Opět je popsána soustavou (1), v rovnici (1a) bude na pravé straně aktuální postupový bod. Podél tečné přímky vedené počátkem opět postoupíme blíže k cíli. Tento proces opakujeme až do jeho vhodného ukončení. Výchozí daný bod a všechny další body, do nichž dojdeme, budeme nazývat postupovými body. Když vynecháme jejich očíslování, opět si je označíme pomocí X. Postupový krok Teoretickým základem každého kroku postupu je rozvoj F ( X + x ) = F ( X ) + F ( X ) T x +..?.. (2) Závislost na změně argumentu x budeme aproximovat pouze prvními dvěma členy rozvoje kde f + v T x (3) f F ( X ) (4a) v F ( X ) (4b) Odpovídající přibližná postupová křivka je dána rovnicemi x ( 0 ) = nulový vektor (5a) d dt x ( t ) = v (5b)

Řešením je x ( t ) = t v (6) Tato aktuální postupová polopřímka se přimyká k teoretické postupové křivce (1) odpovídající aktuálnímu výchozímu postupovému bodu tím více, čím menší je x. Proto alespoň část postupu podle (1) m ůžeme nahradit částí postupu podle (6). Zásadní otázkou je : Jak daleko smíme podle (6) postoupit? Délka kroku postupu Podstatou předkládaného algoritmu je zachování jistého stupně platnosti aproximace. Intuitivně je jasné, že pokud 2. člen v (2) podstatně převýší neznámý 3. člen..?.., budeme jej moci zanedbat. Zvýšení aproximační hodnoty pak bude automaticky znamenat také zvýšení skutečné funkčni hodnoty. Tim se určitě přiblížíme k cíli. Stěžejní relaci zajišťující jistý stupeň platnosti aproximace m ůžeme napsat ve tvaru F ( X + t v ) - f - t v T v t v T v µ (7) Nalevo je absolutní hodnota neznámého členu..?.., v čitateli napravo je známý 2. člen rozvoje. Konstanta µ ve jmenovateli je ostře větší než 1. Reguluje míru platnosti aproximace. Udává totiž dílek aproximační změny funkční hodnoty, o který se m ůže lišit skutečná změna funkční hodnoty. Musíme nalézt co největší hodnotu parametru t splňujícího relaci (7). Vzhledem ke kontextu použití postačují pouze hodnoty z množiny {..., 1/8, 1/4, 1/2, 1, 2, 4, 8,... } Největší vyhovující prvek nalezneme binárním p ůlením. Začneme buď nějakou "rozumnou" hodnotou, např. t = 1, anebo výslednou hodnotou z předchozího kroku. Pro tuto počáteční hodnotu ověříme splnění relace (7). V kladném případě budeme opakovaně zkoušet t t 2. Při prvním neúspěchu se vrátíme k předchozí hodnotě. V záporném případě budeme opakovaně zkoušet t t 2. Při prvním úspěchu jsme hotovi. Ověřování relace (7) vyžaduje výpočet funkční hodnoty v bodě X + t v. V tomto "pr ůzkumném" bodě se ( na rozdíl od postupového bodu ) nevyčíslují derivace! Nalezené t určí další postupový bod X X + t v (8) Ukončení postupových krok ů Teoreticky je postup ukončen, když je v F ( X ) nulové anebo když jsme se velmi přiblížili hranici definičního oboru a směřujeme mimo něj. Numericky nulovost gradientu funkce většinou nenastane! Proto je žádoucí přidat nějakou uživatelskou podmínku ukončení přirozeně odpovídající konkrétní

řešené úloze ( např. dolní mez velikosti v atp. ). Nutné podmínky "strojového" ukončení jsou :.. nedojde ke změně polohy postupového bodu ( X + t v je numericky shodné s X ).. nedojde ke vzr ůstu funkční hodnoty ( t v T v je numericky nula ) Volba řídicího parametru Jediným řídicím parametrem předkládaného algoritmu je konstanta µ figurující v (7). Kdybychom extrémně použili hodnotu 1, mohlo by se stát, že v jednom postupovém kroku v ůbec nedojde ke zvětšení funkčni hodnoty. Proces hledání maxima by v ůbec nemusel skončit. Při použití hodnoty větší než 1 určitě dojde v každém kroku ke zvětšení funkční hodnoty. Jedním z hledisek pro volbu µ m ůže být, jak velké odchýlení od teoretické křivky (1) připustíme. Menší odchylce odpovídá větší µ. Jiné mnohem praktičtější hledisko je, snažit se o co nejmenší počet postupových krok ů. Příliš malá hodnota blízká 1 m ůže vést ke vzr ůstu počtu krok ů díky velkému odklonu od křivky vedoucí k cíli. Příliš velké hodnoty vedou ke vzr ůstu počtu krok ů díky častějšímu přerušování postupu. Optimální bude něco "uprostřed". Praktické pokusy ukázaly, že vhodnou je hodnota v rozmezi 1. 5 až 2. Poznámky Stěžejní myšlenka - dodržení zachování jistého stupně platnosti aproximace - byla již úspěšně použita také v [1] a [2]. Použití kvadratické aproximace vede ke dvěma kvalitativně odlišným situacím : Aproximační funkce je buď neomezená (jako zde) nebo omezená. V druhém případě je vhodným kandidátem na dalši postupový bod poloha maxima aproximační funkce, samozřejmě pokud leží v oblasti přibližné platnosti aproximace. Pokus s použitím aproximace pomocí tří člen ů Taylorovy řady byl učiněn za účelem prozkoumání, zdali nebude lokální maximum nalezeno rychleji. Srovnání bylo provedeno na jedné konkrétní úloze. Na ní byl "složitější" algoritmus asi 30x pomalejší oproti zde prezentovanému algoritmu. Hlavní příčinou zpomalení je asi (opakované) provádění diagonalizace symetrické matice koeficient ů kvadratického členu.

[1] Byczanski,P. : Řešení soustavy nelineárních rovnic, algoritmus»postup01«sborník semináře Moderní matematické metody v inženýrství Ostrava VŠB-TUO 2000 s.22-25 [2] Byczanski,P. : Řešení soustavy nelineárních rovnic, algoritmus»postup08«sborník konference MATLAB 2000 Praha Humusoft 2000 s.61-66