ZAJIŠTĚNÍ SPOLEHLIVÉ ČINNOSTI ADAPTIVNÍHO LQ REGULÁTORU JOSEF BÖHM Ústav teorie informace a automatizace Akademie věd České republiky Pod vodárenskou věží 4, 82 8 Praha 8 fax : +42-2-665268 and e-mail :bohm@utia.cas.cz Abstrakt: Článek se zabývá problematikou zvýšení spolehlivosti adaptivních LQ regulátorů. K tomu se využívá druhý, pevně nastavený regulátor, robustně nastavený, obvykle typu PI. Modifikovaná syntéza adaptivního LQ regulátoru umožňuje spolupracovat s tímto alternativním regulátorem tak, že podle nastavení jedné další penalizační konstanty dociluje toho, že se celkové chování adaptivního regulátoru blíží bud chování robustně nastaveného alternativního regulátoru nebo chování LQ regulátoru charakterizované obvyklými penalizačními maticemi. Klíčová slova: Adaptivní řízení, LQ řízení ÚVOD Použití adaptivního přístupu při návrhu a realizaci regulátoru pro uvažovaný proces přináší celou řadu výhod, zejména: není třeba předem získat přesné parametry modelu procesu, vlastní regulační proces obvykle poskytuje dostatečně vybuzená data pro postupnou dobrou identifikaci, provádění syntézy v každé periodě vzorkování umožňuje snadno modifikovat řídící zákon podle aktuálních požadavků. Nedostatkem přístupu je skutečnost, že v průběhu řízení se obvykle přebírají parametry modelu z procesu identifikace bez jakékoli garance toho, že jejich použití v návrhu regulátoru zajistí dobrý regulační pochod. Nebezpečí špatných odhadů je typické pro počátek adaptačního procesu, kdy se používají apriorní odhady modelu (někdy dostatečně dobré), ale odhady se mohou vychýlit i v průběhu řízení vlivem nepředpokládaných poruch různé povahy. Tato skutečnost je pravděpodobně hlavní důvod pro obavy z použití adaptivního přístupu. Při aplikaci adaptivního regulátoru na konkrétní technologický proces není obvyle obtížné doplnit adaptivní regulátor specifickým supervizorem, který sleduje regulační pochod a v případě, že dojde k závadě či zhoršení procesu, provede akce jako restart regulátoru či přepne na manuální režim. I na obecné úrovni je možné omezit vliv uvedeného jevu do značné míry různými opatřeními, jak v oblasti identifikace, tak v oblasti syntézy. V oblasti identifikace je to především využití apriorní informace o procesu jak pro počáteční odhady parametrů, tak v technice zapomínání v průběho řídícího procesu. Omezené zapomínání Kulhavý a Zarrop [993]; Kulhavý [987] může zajistit, že že se odhady parametrů příliš neodchýlí od alternativního modelu. Ten je obvykle pevný, sestavený na základě apriorních hodnot. Tím se proces identifikace stává méně citlivý na různé poruchy. Aby bylo možné sledovat i proměné parametry je možné alternativní model rovněž vyvíjet v čase. Opatření v oblasti syntézy. Problematika spolehlivé činnosti adaptivního regulátoru zejména v jeho počáteční fázi je do značné míry obdobná problematice připojení libovolného navrženého regulátoru do reálné smyčky. V R53
nedávné minulosti bylo navrženo řešit problematiku připojení regulátoru tak, že pro apriorní znalost modelu se navrhne robustní regulátor, který se aplikuje. V průběhu procesu řízení se sbírají data, která se použijí pro upřesnění modelu, následuje nový návrh robustního regulátoru, kde se však uvažuje menší oblast neurčitosti. Celý proces se pak opakuje. Uvedenému iteračnímu procesu, kdy se střídá identifikace procesu s návrhem řízení v průběhu řízení procesu se někdy říká windsurfer přístup Zang et al. [995]; Schrama [992]. Navíc se v řadě prací (na př. Hjalmarsson et al. [996]) uvádí, že použití dat z uzavřené smyčky pro získání modelu používaného pro návrh regulátoru je výhodnější než použití dat z experimentů v otevřené smyčce. Jedná se tedy o realizaci přístupu, kdy měníme vlastnosti regulátoru podle kvality použitého modelu. Přitom robustní nastavení, které není schopno poskytnou vysokou kvalitu řízení se nastaví jen v případech, kdy model dostatečně přesný, at už tím že jsme na počátku identifikačního procesu nebo se vlivem poruchy přesnost modelu zhoršila. Podíváme-li se na princip adaptivního LQ regulátoru, střídání identifikace a syntézy je jádrem jeho činnosti a řídí se právě popsanými doporučeními s tím, že tyto iterace se provádějí v každé periodě vzorkování. Co se dosud nerealizovalo byl robustní návrh regulátoru v případech, kdy lze očekávat větší neurčitost modelu. 2 SPOLUPRÁCE LQ REGULÁTORU S ALTERNATIVNÍM ROBUSTNÍM REGULÁTOREM Získat robustní regulátor je možné několika způsoby. Zvýšením přirozené robustnosti LQ regulátoru Realizací vhodného PI(D) regulátoru jako reprezentanta robustního návrhu Použitím obecné metodiky robustního návrhu V tomto příspěvku se budeme především věnovat druhému případu, kdy budeme považovat vhodně nastavený PI(D) regulátor za robustní regulátor. Jde zejména o to, že PID regulátor se da poměrně snadno nastavit, ale zejména je většinou pro řízení uvažovaného procesu k disposici. Obecně ale budou naše uvahy platit pro libovolný regulátor, který se dá napsat ve formě u(k) = L A x(k ) () kde x(k) = [y(k), y(k ),..., y(k n), u(k),..., u(k m) L A je vektor koeficientů Problém je jakým způsobem dosáhnout toho, aby se LQ regulátor choval jako PID respektive aby se choval podle předepsaného řídícího zákona L A z (). Potom, proměnnou volbou penalizací v kritériu dosáhneme toho, že generovaný signál takovým regulátorem bude mít vlastnosti blížící se PID regulátoru na jedné straně nebo LQ regulátoru při jiné kombinaci penalizací. Toho lze dosáhnout dvěma způsoby.. Využít vstupu referenčního signálu u. 2. Nalézt takovou penalizační matici Q, která by vedla ke generování akčních zásahů podle přenosu L A. 2. Využití referenčního vstupu Využití referenčního vstupu představuje velmi jednoduchou metodu, jak zkloubit činnost PID regulátoru s LQ. Standardní kritérium pro LQ návrh lze napsat následovně t+t Ψ = [q y (y(k) w(k)) 2 + q u (u(k) u(k)) 2 ] + x (T )S x(t ), (2) t+ R53 2
Minimalizace tohoto kritéria vede na optimální řídící zákon ve tvaru: u(k) = Lx(k ) + Lww(k ) + Luu(k ) (3) Reference vstupu u může být využita následujícím způsobem:. Přirozeně, může mít význam referenční hodnoty vstupu pro daný pracovní bod soustavy. 2. Lze ji uvažovat jako další proměnnou a optimalizací její hodnoty získat regulační pochod bez trvalé regulační odchylky při odezvě na skok Böhm [988]. 3. u nemusí být konstantní. Může to být výstup jiného regulátoru. Necht je u(k) lineární funkcí zpožděných vstupů a výstupů. Tedy u(k) = L A x(k ) (4) V případě, že je u(k) generováno podle (4) nějakým jiným regulátorem, vzniká tak paralelní zapojení LQ regulátoru s altenativním regulátorm L A, nebot vztah (3) se zmnění na u(k) = (L + LuL A )x(k ) + Lww(k ). Výraz (L + LuL A ) je ovlivněn penalizací Q y a Q u. Pro neproměnné Q y bude pro Q u vliv L A zanedbatelný, pro Q u bude LQ regulátor sledovat signál u. Tímto způsobem, změnou Q u, získáme regulátory s různými vlastnostmi, které se budou měnit od regulátoru PID, s řídícím zákonem L A až po standardní LQ regulátor. Pozn. Syntéza regulátoru v tomto případě neví, jak je generován signál u a proto ani není zajištěno, že paralelní kombinace obou regulátorů zajistí stabilitu obvodu. Přes tento nedostatek je uvedené řešení pro svou jednoduchost zajímavé. Zejména v případě, že jako alternativní regulátor zvolíme pouze I regulátor, povede uvedené zapojení k odstranění trvalé regulační odchylky při skokové odezvě. 2.2 Modifikace kvadratického kritéria. Výše popsaný nedostatek je však možno odstranit v případě, že se podaří nalézt takové kvadratické kritérium, jehož minimalizace vede na předepsaný řídící zákon PID regulátoru. Ukážeme si, jak toho můžeme dosáhnout. Vyjdeme z toho, že syntézu regulátoru však lze provést pro obecnější formu kritéria. Bobál et al. [998, 25] Ψ = t +T t + Q + Q2 +... Qn (5) kde z(k) = [u(k), x(k )] a Qi = z(k) f i αf iz(k) f i je vektor parametrů a má dimenzi odpovídající vektoru z(k). Vidíme, že kvadratická forma Qi může obsahovat tak zvaný křížévý člen, tedy penalizaci typu u(k) Q ux x(k ) Právě tento typ penalizace v kvadratickém kritériu využijeme pro náš cíl. Obvykle jsou penalizace u a x (resp. y) striktně odděleny. Dokonce se ukazuje, že pokud by se takový člen (u Q ux x) v kritériu objevil, lse se ho zbavit substitucí u = ũ + Q u Q ux x (6) R53 3
Zde naopak budeme takový křížový člen uvažovat a jeho váhu Q ux využijeme k imitaci chování PID regulátoru. Uvažujme penalizační matici ve tvaru: [ ] LA Q A = α (7) a kritérium J = t +T t + L A L A L A αz(t)q A z(t) Pak se dá ukázat, že jeho minimalizace vede na řídící zákon u (k) = L A x(k ). L A představuje zvolený řídící zákon. Použitím kritéria J = t +T t + z(t)(q + αq A ) z(t) (9) kde Q je jakákoli penalizační matice taková aby (2) dával rozumně naladěný PID reguláror. Potom změnou hodnoty α z k můžeme nastavovat LQ regulátor plynule ta, aby měnil chování od pevnného, předem nastaveného regulátoru L A, až po požadované chvání LQ regulátoru. u(t) = u(t )+k I (w(t ) y(t ))+k P (y(t ) y(t 2)+k D (y(t ) 2y(t 2)+y(t 3))() Pozn. Pokud použijeme kritérium (9) a řídící zákon L A nebude stabilizující, bude řízení LQ regulátoru vždy stabilizující i pro veliké hodnoty α. V takovém případě ale nebude imitováno chování řízení L A. Pokud je však L A stabilizující, bude LQ regulátor pro velké α tento řídící zákon imitovat. 2.3 Proměnná penalizace Adaptivní LQ regulátor provádí syntézu znova v každé periodě vzorkování. To je možné využít ke změně vlastností regulátoru podle okamžitých podmínek regulačního procesu. vzhledem k tomu,že přirozená robustnost diskretního LQ regulátoru závisí na penalizacích Bobál et al. [998], je možné volit na počátku adaptačního procesu jiné penalizace (zejména je vhodné použít velkou penalizci Q u ) než později, kdy došlo k upřesnění modelu. V porovnání s předchozími opatřeními je však tento přístup méně účinný. 3 PŘÍKLADY Realizace modifikovaného kritéria (9) je velmi jednoduchá a to zejména v odmocninových algoritmech LQ syntézy popsaných v Bobál et al. [998, 25] Typické chování takového regulátoru si ukážeme na několika jednoduchých příkladech. Uvažujme jednoduchou soustavu 2. řádu s přenosem F (z.47.44z ) =.8z, () +.82z 2 kterou použijeme v simulačním schematu na obr. na obr.2 vidíme regulační průběh s pevným PI regulátorem s přenosem R(z ) = z 9.5z 2 z Na obr.3 je vidět standardní běh s adaptivním LQ regulátorem. Jsou vidět typické zákmity na počátku procesu, způsobené nedostatečnou znalostí modelu. Na obr.4 je vidět půběh regulačního pochodu připřechodu od PI k LQ a na obr.5 je zachycen průběh filtrovaného kvadrátu chybu predikce, kterým byl přestavení LQ regulátory realizováno. (8) R53 4
Band Limited White Noise.5 Gain4.2 z 2.8z+.89 Discrete Transfer Fcn2 yout To Workspace Constant Switch.47z 2+.43z z 2.8z+.89 Discrete Transfer Fcn Sum2 Mux Mux Scope Scope LQ adaptive controller Controller z 9.8z 2 z Discrete Filter Sum3 Signal generator necessary to define sampling per. To in the workspace MATLAB Function MATLAB Fcn.8z Discrete Filter Scope2 Mux uout To Workspace.826 Mux Slider Gain Obrázek Simulační schema PID controller.5 output,noise.5.5 2 4 6 8 2 4 6 8 2 time 5 5 2 4 6 8 2 4 6 8 2 Obrázek 2 Průběhy kompenzace poruchy s PI regulátorem R53 5
5 LQ controller 4 output,noise 3 2 2 2 4 6 8 2 4 6 8 2 time 5 input 5 2 4 6 8 2 4 6 8 2 Obrázek 3 Průběhy kompenzace poruchy s LQ regulátorem PID > LQ.5 output,noise.5.5 2 4 6 8 2 4 6 8 2 time 5 5 2 4 6 8 2 4 6 8 2 Obrázek 4 Průběhy kompenzace poruchy s přestavovaným LQ regulátorem R53 6
8 6 4 squared prediction error 2 8 6 4 2 5 5 2 25 time Obrázek 5 Průběhy kvadrátu chyby predikce R53 7
4 ZÁVĚR Práce se zabývá problematikou, jak zajistit spolehlivou činnost adaptivního LQ regulátoru. Jednoduchou modifikací kvadratického kritéria lze získat možnost ladit plynule vlastnosti LQ regulátoru tak, že regulátor imituje chování předem pevně nastaveného PID regulátoru ale je možno ho ručně nebo automaticky plynule přeladit na vlastnosti standardního LQ. ACKNOWLEDGMENTS Reference Tato práce byla podporována Grantovou agenturou České republiky grantem 2/5/27. BOBÁL, V.; BÖHM, J.; MACHÁČEK, J.; FESSL, J. 25. Digital Self-tuning Controllers. London: Springer. BOBÁL, V.; BÖHM, J.; PROKOP, R.; FESSL, J. 998. Practické aspekty samočinně se nastavujících regulátoru. Brno, Česká republika: Publikační oddělení VUT Brno. BÖHM, J. 988. The set point control and offset compensation in the discrete LQ adaptive control. Problems of Control and Information Theory, 7, 3, 33 46. HJALMARSSON, H.; M.GEVERS; DE BUYNE, F. 996. Model-based control design, closed-loop identification gives better performance. Automatica, 32, 659 673. KULHAVÝ, R. 987. Restricted exponential forgetting in real-time identification. Automatica, 23, 5, 589 6. KULHAVÝ, R.; ZARROP, M. B. 993. On general concept of forgetting. International Journal of Control, 58, 4, 95 924. SCHRAMA, R. 992. Accurate identification for control: the necessity of an iterative scheme. IEEE Trans. Autom. Control, AC-37, 99 994. ZANG, Z.; BITMEAD, R.; M.GEVERS 995. Iterative weighted least-squares identification and weighted lqg control design. Automatica, 3, 577 594. R53 8