VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta elektrotechniky a komunikačních technologií Ústav radioelektroniky Doc. Dr. Ing. Zbyněk Raida ODELOVÁNÍ IKROVLNNÝCH STRUKTUR Tradiční a netradiční přístupy ODELING ICROWAVE STRUCTURES Conventional and non-conventional approaches INAUGURAČNÍ PŘEDNÁŠKA KE JENOVÁNÍ PROFESORE V OBORU ELEKTRONIKA A SDĚLOVACÍ TECHNIKA BRNO 003
KLÍČOVÁ SLOVA Numerická analýza, mikrovlnné struktury, kmitočtová oblast, časová oblast, umělé neuronové sítě, optimalizace KEYWORDS Numerical analysis, microwave structures, frequency domain, time domain, artificial neural networks, optimization Zbyněk Raida, 003 ISBN 80-14-415-X ISSN 113-418X
OBSAH 1 ÚVOD... 5 1.1 Diferenciální formulace axwellových rovnic... 5 1. Integrální formulace axwellových rovnic... 6 1.3 Obecný postup numerické analýzy... 8 NUERICKÉ ODELOVÁNÍ IKROVLNNÝCH STRUKTUR... 10.1 Planární mikrovlnná vedení... 11. Drátové antény... 14.3 Závěry... 15 3 NEURONOVÉ ODELOVÁNÍ IKROVLNNÝCH STRUKTUR... 16 3.1 Neuronové sítě... 16 3. Dopředné neuronové modely... 17 3.3 Rekurentní neuronové modely... 18 3.4 Závěry... 0 4 HISTORIE A SOUČASNOST ODELOVÁNÍ IKROVLNNÝCH STRUKTUR... 0 4.1 Etapa raných prací... 0 4. Dielektrická etapa... 0 4.3 Etapa časové oblasti... 1 5 LABORATOŘ NUERICKÝCH ETOD FEKT VUT V BRNĚ... 5.1 Výzkumné aktivity... 5.1.1 Numerická analýza mikrovlnných struktur... 5.1. Optimalizace mikrovlnných struktur... 3 5.1.3 Neuronové modelování... 3 5.1.4 Objektově orientovaná implementace... 3 5. Pedagogické aktivity... 4 5.3 Popularizace výsledků výzkumu... 4 5.4 Závěr... 5 Literatura... 6 Abstract... 31
Zbyněk Raida se narodil v roce 1967 v Opavě. V roce 1986 absolvoval gymnázium. Koperníka v Bílovci a v roce 1991 Fakultu elektrotechniky a informatiky VUT v Brně, obor Radioelektronika. V roce 1994 obhájil na této fakultě disertační práci s názvem Stabilita digitálních adaptivních antén a získal tak vědeckou hodnost doktor. V roce 1993 byl přijat na místo asistenta na ústavu radioelektroniky FEI VUT v Brně. V letech 1996 a 1997 strávil 6 měsíců na Université Catholique de Louvain v Louvain-la-Neuve v Belgii na pozici nezávislého vědeckého pracovníka. V roce 1998 předložil na FEI VUT habilitační práci s názvem Full-wave finite-element analysis of general microwave waveguides, po jejíž úspěšné obhajobě mu byl udělen titul docent. V pedagogické oblasti se Dr. Raida věnuje výuce využití numerických metod pro analýzu a optimalizaci mikrovlnných struktur (předměty Numerické metody v elektrotechnice, Optimalizace v elektrotechnice v doktorském studiu, předmět CAD ve vysokofrekvenční a mikrovlnné technice v magisterském studiu), výuce programování v jazyce Pascal (předmět Objektově orientované programování v Borland Pascalu v magisterském studiu) a výuce programování v jazyce C (předmět Počítače a programování v bakalářském studiu). Dr. Raida vedl více než 30 diplomových prací, které byly zaměřeny na numerické modelování a optimalizaci mikrovlnných struktur, na využití umělých neuronových sítí a genetických algoritmů pro jejich návrh, na adaptivní anténní systémy a na tvorbu multimediálních učebních textů. Dr. Raida vedl (vede) celkem 7 doktorandů. Výzkumná práce Dr. Raidy je zaměřena na využití numerických metod pro analýzu mikrovlnných struktur a na optimalizaci těchto struktur pomocí tradičních i netradičních přístupů. Dr. Raida byl řešitelem jednoho grantu Grantové agentury České republiky a na řešení několika dalších grantů této agentury spolupracoval. Dále řešil několik grantů Fondu rozvoje vysokých škol a jeden grant VUT. Dr. Raida spolupracuje na řešení dvou výzkumných záměrů. V letech 001 až 00 zastával Dr. Raida funkci zástupce vedoucího ústavu radioelektroniky Fakulty elektrotechniky a komunikačních technologií VUT v Brně, od roku 00 je proděkanem pro tvůrčí činnost na této fakultě. Dr. Raida je členem mezinárodní organizace inženýrů elektrotechniky a elektroniky IEEE. Od roku 001 je předsedou společnosti pro mikrovlnnou techniku, antény a mikroelektroniku československé sekce IEEE. V roce 00 byl jmenován starším členem IEEE. Dr. Raida je členem Společnosti pro radioelektronické inženýrství, která je vydavatelem mezinárodního vědeckého časopisu Radioengineering. V letech 001 až 00 byl Dr. Raida výkonným redaktorem tohoto časopisu, od roku 00 je jeho šéfredaktorem. 4
1 ÚVOD ikrovlnným kmitočtovým pásmem rozumíme rozmezí frekvencí od 300 Hz do 300 GHz [1] (obr. 1.1). Uvědomíme-li si, že mobilní telefony GS pracují v pásmech 900 Hz a 1,8 GHz nebo že taktovací frekvence moderních procesorů přesahují GHz, musíme uznat, že mikrovlnná technika se stala součástí našeho každodenního života. ikrovlnná zařízení jsou specifická tím, že jejich rozměry jsou srovnatelné s vlnovou délkou zpracovávaných signálů. Nelze tedy uvažovat pouze časový průběh veličiny, jako je tomu u nízkofrekvenčních obvodů v případě napětí a proudů (rozměry obvodů jsou mnohem menší než je vlnová délka). A nelze rovněž uvažovat pouze prostorové rozložení veličiny, jako je tomu u optických soustav v případě vlnových svazků (rozměry soustav jsou mnohem větší než je vlnová délka). V případě mikrovlnných struktur musíme pracovat s časoprostorovým rozložením elektromagnetického pole, musíme striktně uvažovat vlnový charakter všech veličin, musíme se důsledně držet vektorového popisu všech jevů [1]. 300 GHz 300 Hz mm cm dm m viditelné záření infračervené záření IKROVLNY VKV KV SV... RÁDIOVÉ VLNY Obr. 1.1 Vymezení mikrovlnného pásma v kmitočtovém spektru Chceme-li vytvořit obecně platný matematický model mikrovlnné struktury, musíme vyjít z nezjednodušeného tvaru axwellových rovnic. V dalších odstavcích si připomeneme jejich diferenciální a integrální formulaci a zamyslíme se nad možnostmi jejich řešení. 1.1 Diferenciální formulace axwellových rovnic axwellovy rovnice v diferenciálním tvaru lze vyjádřit následujícími čtyřmi vztahy []: D H = + Jind + J t B E = t en ( 1.1 ) ( 1. ) D = ρ ( 1.3 ) B = 0 ( 1.4 ) Ve vztazích (1.1) až (1.4) značí E a H vektory intenzity elektrického a magnetického pole, D a B jsou vektory elektrické a magnetické indukce, J ind a J en značí vektor plošné hustoty proudu indukovaného a proudu vnuceného zdroji, ρ je objemová hustota náboje a diferenciální operátor. První axwellova rovnice (1.1) vyjadřuje Ampérův zákon celkového proudu, druhá rovnice (1.) je vyjádřením Faradayova indukčního zákona. Rovnice třetí (1.3) popisuje Gaussův zákon 5
elektrostatiky a čtvrtá axwellova rovnice (1.4) je vyjádřením zákona spojitosti siločar magnetické indukce. Popis elektromagnetického pole rovnicemi (1.1) až (1.4) není úplný. Základní rovnice je třeba doplnit materiálovými vztahy [] D = ε E ( 1.5 ) B = µ H ( 1.6 ) J = σ E ( 1.7 ) ateriál je popsán tenzorem permitivity ε, tenzorem permeability µ a měrnou vodivostí σ. V případě diferenciální formulace je zapotřebí popis doplnit okrajovými podmínkami a podmínkami na rozhraní dvou prostředí []. Diferenciálního popisu s výhodou využíváme v případě uzavřených struktur, u nichž jsou okrajové podmínky na ohraničujících plochách známy. Typickými příklady takových struktur jsou mikrovlnná přenosová vedení (obr. 1.). a) ε µ b) ε µ c) ε µ 0 0 0 0 0 0 w t ε µ ε µ 1 1 1 1 Obr. 1. ikrovlnná přenosová vedení: a) obdélníkový vlnovod, b) vlnovod s dielektrickou vložkou, c) stíněné mikropáskové vedení Analytické řešení axwellových rovnic aplikovaných na tyto struktury je známo jen pro nejjednodušší vedení. Jako příklad si uveďme podélně homogenní duté vlnovody, u nichž předpokládáme vzduchovou výplň a dokonalou elektrickou vodivost kovového pláště. V takové struktuře se elektromagnetická energie může šířit formou příčně elektrické vlny (intenzita magnetického pole má nenulovou složku ve směru šíření) nebo formou vlny příčně magnetické (nenulovou složku ve směru šíření má intenzita pole elektrického) [1], [3]. Situace se ovšem významně změní již v okamžiku, kdy do vlnovodu umístíme dielektrickou vložku (pro jednoduchost bezeztrátovou). Elektromagnetické pole spojitě přechází z dielektrika do vzduchu a naopak. Tento spojitý přechod pole mezi prostředími je fyzikálně možný jen tehdy, máli elektromagnetická vlna ve směru šíření nenulové složky intenzity elektrického i magnetického pole. Hovoříme o šíření hybridních vln. Struktura těchto vln je již natolik složitá, že ji nelze vypočíst analyticky [4]. Situace se ještě více zkomplikuje, naneseme-li na horní plochu dielektrické vložky (substrátu) kovový mikropásek. Elektromagnetické pole ve struktuře indukuje v kovovém mikropásku proudy, které způsobují vzájemné provázání hybridních vln. Vzniklé vlnění označujeme jako longitudinal section electric (LSE) a longitudinal section magnetic (LS) [3]. Pro výpočet takových vln nezbývá než použít numerické metody [3], [5] [8]. 1. Integrální formulace axwellových rovnic axwellovy rovnice můžeme relativně snadno převést z diferenciální formy zápisu (1.1) až (1.4) do formy integrální []: 6
l H dl = I ind + I en + dψ d t ( 1.8 ) l S dφ E dl = d t S D ds = Q B ds = 0 ( 1.9 ) ( 1.10 ) ( 1.11 ) Ve vztazích (1.8) až (1.11) značí E a H vektory intenzity elektrického a magnetického pole, D a B jsou vektory elektrické a magnetické indukce, I ind a I en značí indukovaný proud a proud vnucený zdroji, ψ a φ jsou elektrický a magnetický indukční tok, Q značí elektrický náboj, dl je vektor elementárního úseku a ds je vektor elementární plošky. Soustavu rovnic (1.8) až (1.11) musíme opět doplnit materiálovými vztahy (1.5) až (1.7). Na rozdíl od diferenciální formulace však nemusíme doplňovat okrajové podmínky, protože ty jsou v integrální formulaci již zahrnuty. Vzhledem k této skutečnosti integrálního popisu s výhodou využíváme v případě otevřených struktur, jejichž elektromagnetické pole zasahuje do celého prostoru, v němž je struktura umístěna. Typickými příklady takových struktur jsou mikrovlnné antény (obr. 1.3). a) b) B z A h h a h ε r Obr. 1.3 Dipóly: a) drátový, b) mikropáskový Analytický výpočet elektromagnetického pole vyzařovaného anténou je znám pouze pro elementární dipóly (elektrický, magnetický). U reálných antén je nutno vždy počítat parametry buď pomocí přibližných, nebo numerických metod [9], [10]. V případě symetrického dipólu, který je vyroben z velmi tenkého drátu (vzhledem k vlnové délce), si můžeme anténu představit jako řadu elementárních dipólů, které se vzájemně ovlivňují a vzájemně přispívají k elektromagnetické vlně vyzařované anténou. Situace se opět komplikuje v případě, kdy symetrický dipól vyrobíme planární technologií na dielektrickém substrátu, jehož rubová strana je souvisle pokovena. Elektromagnetická vlna vyzařovaná dipólem se mnohonásobně odráží od kovové plochy na jedné straně a částečně od rozhradí dielektrikum-vzduch na straně druhé. Vzniká velmi komplikované blízké pole antény, které nejsme schopni analyticky popsat. Proto i v případě integrální formulace je třeba při řešení reálných struktur využít numerických metod [11] [13]. S obecným postupem numerické analýzy mikrovlnných struktur se seznámíme v následujícím odstavci. 7
1.3 Obecný postup numerické analýzy Postup numerické analýzy (ať již vychází z diferenciální formulace nebo formulace integrální) lze rozdělit do šesti základních kroků: I. Diskretizace analyzované struktury Strukturu rozdělíme na diskretizační prvky, které se vzájemně nepřekrývají a které v sobě zahrnují všechny body analyzované struktury. V případě velmi úzkého drátového dipólu (obr. 1.4a) lze s přivřením očí předpokládat, že náboje a proudy jsou koncentrovány na ose vodiče. Diskretizačními prvky jsou pak v tomto případě jednorozměrné diskretizační prvky (úsečky), jejichž sjednocením získáme celou osu antény. V případě podélně homogenního ploutvového vedení (obr. 1.4b) je zapotřebí diskretizační sítí pokrýt celý průřez analyzované struktury. Diskretizační prvky jsou tudíž dvojrozměrné (trojúhelníky). a) b) Obr. 1.4 Diskretizace analyzované struktury: a) jednorozměrná, b) dvojrozměrná Na diskretizační síť jsou kladeny protichůdné požadavky. Chceme-li dosáhnout co možná nejvyšší přesnosti výsledků analýzy, musí být diskretizační síť hodně jemná. Jemná síť ovšem sestává z velkého počtu diskretizačních prvků, a tudíž vykazuje velmi vysoké výpočetní nároky. Proto je výhodné využít všech symetrií analyzované struktury a počítat vždy jen její část [14]. II. Formální aproximace hledané veličiny Hledanou veličinu formálně aproximujeme nad každým diskretizačním prvkem pomocí známých bázových funkcí f i a neznámých aproximačních koeficientů c i. Nejčastěji se používají bázové funkce, které mají nad diskretizačním prvkem konstantní (obr. 1.5a), lineární (obr. 1.5b) nebo kvadratický průběh. a) c c 3 c 4 c c c 3 c 4 5 b) c 5 c 6 c c 1 c 6 c7 ~ f(z) f i 1 c7 f ~ i 1 f(z) 1 f(z) f(z) z Obr. 1.5 Formální aproximace hledané veličiny: a) po částech konstantní, b) po částech lineární Aproximace je formální z toho důvodu, že průběh aproximované veličiny neznáme (neznáme aproximační koeficienty c i ). Naším úkolem je aproximační koeficienty určit tak, aby získaná aproximační funkce co možná nejpřesněji splňovala axwellovy rovnice aplikované na popis analyzované struktury. z 8
III. Dosazení formální aproximace do řešené rovnice Řešenou rovnici vyjádříme symbolicky jako F [ E( r, s) ] f ( r, s) = 0 ( 1.1 ) kde F je integrální nebo diferenciální operátor, E je hledané rozložení pole (zde reprezentované vektorem intenzity elektrického pole), r značí polohový vektor bodu, v němž intenzitu pole počítáme, a s hraje roli kmitočtu (analyzujeme-li strukturu v ustáleném harmonickém stavu) nebo času (analyzujeme-li neustálený, přechodný děj). Funkce f (r, s) popisuje známé zdroje počítaného elektromagnetického pole. Dosazením formální aproximace E ~ (r, s) do (1.1) namísto přesného řešení E(r, s) dospějeme ke vztahu F = ~ [ E( r, s) ] f ( r, s) = F c N ( r, s) f ( r, s) c m m = 1 F [ N ( r, s) ] f ( r, s) = R( r, s) m m m = 1 m = ( 1.13 ) Aproximace je vyjádřena jako součet součinu neznámého skalárního aproximačního koeficientu c m a známé vektorové bázové funkce N m na m-tém diskretizačním prvku. Součiny c m N m sčítáme přes všech diskretizačních prvků, na něž je analyzovaná struktura rozdělena. Jelikož operátor F je lineární, můžeme zaměnit pořadí aplikace operátoru a sčítání. Jelikož c m je konstanta (i když v tuto chvíli neznámá), můžeme ji vytknout před operátor. Tím dostáváme součet neznámých c m násobených známými funkcemi F[N m (r,s)]. Nelze si nevšimnout skutečnosti, že nulová pravá strana řešené rovnice (1.1) se změnila po dosazení aproximace na nenulovou funkci R(r,s), jejíž hodnota závisí na poloze r. Tuto funkci nazýváme reziduem (zbytkovou funkcí). V podstatě jí vyjadřujeme skutečnost, že aproximace se od přesného řešení odchyluje a že velikost této odchylky závisí na poloze (viz obr. 1.5). V dalším kroku se budeme snažit nalézt takové hodnoty aproximačních koeficientů c m, aby zbytková funkce nabývala co možná nejmenších hodnot. Tím dosáhneme co možná nejvyšší přesnosti aproximace řešení. IV. inimalizace rezidua K minimalizaci zbytkové funkce používáme obvykle metodu vážených reziduí. Tato metoda spočívá ve vynásobení zbytkové funkce R(r,s) vhodnou váhovou funkcí W n (r,s), v integraci součinu přes celou analyzovanou oblast a v položení výsledku integrace nule V [ W ( r, s) R( r, s) ] dv () r = 0 n ( 1.14 ) Tím v podstatě vyjadřujeme požadavek, aby střední vážená chyba řešení přes celý analyzovaný prostor byla nulová. Volíme-li za váhovou funkci funkci bázovou, hovoříme o Galerkinově metodě [15] V = N c n m m = 1 ( r, s) c F [ N ( r, s) ] + N ( r, s) f ( r, s) dv ( r) V m m = 1 { N ( r, s) F [ N ( r, s) ]} dv ( r) + { N ( r, s) f ( r, s) } dv ( r) = 0 n m m n V n = ( 1.15 ) 9
Vztah (1.15) je jednou rovnicí pro neznámých koeficientů c m. V integrálech přes analyzovanou oblast V totiž vystupují pouze známé bázové funkce a známý operátor, takže lze tento integrál vyjádřit jediným konkrétním číslem. I druhý člen můžeme vyjádřit konkrétním číslem, neboť se jedná o určitý integrál součinu známé váhové funkce a známé funkce zdrojové. Pokud reziduum postupně násobíme různými váhovými funkcemi, dospějeme k soustavě lineárních algebraických rovnic pro neznámých aproximačních koeficientů c m. V. Řešení maticové rovnice Výslednou maticovou rovnici můžeme symbolicky vyjádřit ve tvaru N N N 1 F F F ( N1) dv N1 F ( N ) dv L N1 F ( N ) ( N ) dv N F ( N ) dv L N F ( N ) 1 dv c1 dv c = ( N ) dv N F ( N ) dv L N F ( N ) dv c N f dv 1 Jejím řešením získáme doposud neznámé aproximační koeficienty c m. O N 1 f dv N f dv ( 1.16 ) VI. Dosazení koeficientů do formální aproximace Dosazením vypočtených aproximačních koeficientů do formální aproximace získáme (nyní již neformální) aproximační funkci, která popisuje přibližné řešení úlohy ve všech bodech analyzovaného prostoru, a to s minimální chybou v globálním významu. Tím je úkol numerické analýzy splněn. V dalších odstavcích se budeme numerické analýze věnovat podrobněji. Ukážeme si, jak konkrétně vypadá analýza elektromagnetického pole v ustáleném harmonickém stavu (hovoříme o analýze v kmitočtové oblasti) a jak se od ní odlišuje výpočet přechodných jevů při ustalování pole (hovoříme o analýze v oblasti časové). Problémem numerické analýzy je její relativně vysoká výpočetní náročnost. Pokud tedy potřebujeme modely mikrovlnných komponentů zabudovat do komplexního návrhového softwaru, v němž je analýza několikanásobně opakována během optimalizačního iteračního procesu, je zapotřebí výsledky numerické analýzy aproximovat. V následujících kapitolách si ukážeme, jak lze k tomuto účelu využít uměných neuronových sítí. NUERICKÉ ODELOVÁNÍ IKROVLNNÝCH STRUKTUR Numerickou analýzou mikrovlnné struktury v kmitočtové oblasti rozumíme výpočet rozložení elektromagnetického pole v této struktuře v ustáleném harmonickém stavu. To znamená, že uvažujeme časovou závislost veličin vyjádřenou ve tvaru ( r, t) E( r) exp( jω t) E = (.1 ) kde r je polohový vektor bodu, v němž intenzitu pole počítáme, ω je úhlový kmitočet, na němž pole analyzujeme, j značí imaginární jednotku, t je čas a E je vektor intenzity elektrického pole. Analýza v kmitočtové oblasti je relativně snadná. Časovou derivaci veličiny s harmonickým průběhem totiž můžeme nahradit vynásobením veličiny koeficientem jω, integraci harmonické veličiny podle času můžeme nahradit dělením veličiny koeficientem jω. 10
Nicméně, analýza v kmitočtové oblasti má i své nevýhody. Z teoretického pohledu ustálený harmonický stav fyzikálně neexistuje. Elektromagnetické pole by totiž muselo v harmonickém stavu existovat nekonečně dlouho (časové omezení vynásobení časového průběhu obdélníkovým oknem by totiž způsobilo vznik dalších spektrálních složek). Navíc nekonečně dlouhé trvání elektromagnetického pole je spojeno s nekonečně velkou energií, kterou bohužel nemáme k dispozici. Z praktického hlediska lze za harmonické pole považovat pole, které trvá dostatečně dlouho. Pokud chceme analyzovat mikrovlnnou strukturu v dostatečně širokém pásmu kmitočtů, musíme při formulování problému v kmitočtové oblasti provádět analýzu opakovaně na tolika frekvencích, aby bylo s dostatečným rozlišením pokryto celé toto pásmo. Jednotlivé analýzy přitom běží nezávisle na sobě (nedochází k přenosu relevantní informace mezi jednotlivými výpočty), což je dosti neefektivní. Co se týká analýzy mikrovlnných struktur v časové oblasti, ta vykazuje při srovnání s analýzou v oblasti kmitočtové komplementární vlastnosti. U časové analýzy nelze předpokládat ustálený harmonický stav, a proto nelze časová derivování a integrování nahradit násobením či dělením koeficientem jω. Počítané veličiny se v čase mění, a tudíž přibývá analýze další rozměr. Analýza je proto matematicky komplikovanější a náročnější na výpočetní výkon. Při analýze v časové oblasti předpokládáme buzení analyzované struktury úzkým budicím impulsem. Budicí a vybuzené elektromagnetické pole tudíž vykazují konečné trvání a konečnou energii. Navíc úzké budicí impulsy mají relativně široké kmitočtové spektrum, takže během jednoho jediného výpočtu získáme informaci o chování analyzované struktury v celém pásmu kmitočtů najednou. Při časové analýze se rozložení elektromagnetického pole v budoucím okamžiku počítá z rozložení pole v okamžicích předešlých. To je stejné, jako bychom v kmitočtové oblasti počítali chování struktury na novém kmitočtu s využitím výsledků získaných pro kmitočty staré. Analýza v časové oblasti je tedy efektivnější než analýza v oblasti kmitočtové [16] [19]. Blíže se s analýzou v kmitočtové a časové oblasti seznámíme na konkrétních příkladech..1 Planární mikrovlnná vedení Uvažujme podélně homogenní stíněné mikrovlnné vedení (obr..1, vlastnosti vedení se ve směru podélné osy z nemění). Budeme-li předpokládat, že se podél tohoto vedení šíří pouze přímá vlna (vedení je zakončeno dokonale pohlcující zátěží), lze závislost vektoru intenzity elektrického pole na podélné souřadnici z vyjádřit vztahem E ( x, y, z) = E( x, y) exp( γ z) kde γ je komplexní konstanta šíření γ = α + jβ α značí činitel útlumu a β je fázová konstanta. Popis vlny šířící se podél vedení musí vyhovovat vektorové vlnové rovnici [] y 0 rovina symetrie a w/ ε µ 0 0 ε µ 1 1 t h x 0 Obr..1 Stíněné podélně homogenní mikropáskové vedení b (. ) (.3 ) 11
1 µ t t t ( E) + ε E + σ E = J (.4 ) kde ε značí permitivitu, µ permeabilitu a σ měrnou vodivost dielektrického materiálu ve vedení. Vektor J je vektorem hustoty budicího proudu a E je vektor intenzity hledaného rozložení pole. Díky známé závislosti intenzity pole na podélné souřadnici (.) lze ve vlnové rovnici vyčíslit všechny derivace podle z a výslednou rovnici lze numericky řešit, čímž dospějeme k neznámému rozložení intenzity pole v průřezu vedení. Použijeme-li k numerickému řešení metodu konečných prvků [14], využijeme k aproximaci podélné složky pole E z (x, y) uzlových konečných prvků a k aproximaci příčného vektoru pole E t (x, y) hranových konečných prvků [5], [6]. Analyzujeme-li vedení v kmitočtové oblasti (na úhlovém kmitočtu ω), lze hledané pole vyjádřit pomocí bilineární formy [6] B ( v, u) = γ ( v + v ) ( u + u ) k + k 0 0 Ω ( ε r vz uz ) Ω ( ε r vt ut ) 1 µ = 0 Ω 1 t z µ Ω r dω + r dω ( v ) ( u ) t t t t t t dω z = t dω (.5 ) Ve výše uvedeném vztahu značí v = v t + v z z 0 váhovou vektorovou funkci, kterou minimalizujeme reziduum, a u = u t + u z z 0 je vektor intenzity počítaného rozložení pole. Dolní index t označuje transversální veličiny (leží v příčné rovině xy, obr..1). Symbol µ r značí relativní permitivitu dielektrického substrátu ve vedení a ε r je komplexní relativní permitivita, do níž jsou zahrnuty ztráty σ. Symbol γ je komplexní konstanta šíření (.3) a symbol k 0 značí vlnové číslo ve vakuu. Integraci součinu váhové funkce s aproximací rozložení pole (.5) provádíme přes celou analyzovanou oblast Ω a výsledek položíme roven nule. V bilineární formě nevystupuje žádný člen, který by popisoval zdroje elektromagnetického vlnění. Vedení totiž analyzujeme v relativně velké vzdálenosti od zdrojů, takže zdrojové složky pole jsou zanedbatelné vzhledem ke složkám vírovým (zdrojem magnetického pole je pole elektrické a naopak). Pokud bychom chtěli analyzovat planární vedení v časové oblasti, situace se poněkud změní: V analyzované oblasti musejí být přítomny zdroje elektromagnetického pole. Jedině tak můžeme realizovat úzký budicí impuls, a jedině tak můžeme získat odezvu analyzované struktury v celém pásmu kmitočtů. Od zdrojů pole (např. mikropásek protékaný vnuceným proudem) se na všechny strany šíří kulová vlna. Tato vlna se odráží od stěn stínicího vlnovodu, takže v příčném průřezu vedení vzniká stojaté vlnění a elektromagnetická energie se vedením šíří jen v podélném směru. 1
Při matematické formulaci problému v časové oblasti tedy nelze uvažovat šíření vlny v podélném směru popsané vztahem (.), ale je nutno pracovat s šířením kulové vlny do všech směrů kolem mikropásku. V matematickém popisu nesmí vystupovat kmitočet a veličiny, které jsou s kmitočtem svázány (konstanta šíření, vlnové číslo, ). Popis musí totiž současně platit pro všechny frekvence, které jsou obsaženy ve spektru budicího impulsu. Uvážíme-li všechny tyto skutečnosti, můžeme hledané pole vyjádřit bilineární formou [0] B 1 = v u dω µ Ω r 1 u + Ω + v ε r d c t Ω J + µ 0 v dω + t Ω 1 u + v n dω = c t Ω = 0 ( v, u) (.6 ) Rozdíly mezi formulacemi (.5) a (.6) přitom odpovídají našim výše vysloveným úvahám. Význam symbolů v (.6) je týž jako ve vztahu (.5). Navíc c značí rychlost světla ve vakuu, J je vektor hustoty budicího proudu, n je normálový vektor k hranici analyzované oblasti a t značí čas. Na rovnice (.5) nebo (.6) můžeme aplikovat obecný postup numerického řešení, jak byl uveden v kapitole 1.3. Konkretizujme tento postup pro analýzu stíněného mikropáskového vedení ve vzduchovém prostředí (obr..) a využijme přitom specifických přístupů metody konečných diferencí v časové oblasti [16], [17] a metody konečných prvků v časové oblasti [0]. Srovnáme-li vypočtené hodnoty kritického kmitočtu dominantního vidu pro různý počet segmentů, na něž byla struktura diskretizována, dostaneme závislost uvedenou na obr..3. Chyba je vztahována k velmi přesnému numerickému řešení v kmitočtové oblasti (velmi vysoký počet diskretizačních prvků). A = 1,7 mm error [%] 0.5 0.0 A h = 1,7 mm w = 1,7 mm Obr.. "Air-supported microstrip transmission line" jako testovací struktura pro řešení (.5-6) -0.5 TD-FE (lin) TD-FE (quad) FDTD -1.0 10 0 30 40 segments Obr..3 Srovnání relativní chyby analýzy testovací struktury metodou konečných diferencí (FDTD) a metodou konečných prvků (TD-FE) v časové oblasti při použití lineární a kvadratické aproximace pole 13
Z obr..3 je zřejmé, že nejvyšší přesnosti dosahuje metoda konečných prvků v časové oblasti při použití kvadratické aproximace rozložení pole. Nevýhodou této metody jsou relativně vysoké výpočetní nároky [1], [].. Drátové antény V případě analýzy antén je vhodné vyjít z integrální formulace axwellových rovnic. axwellovy rovnice však neřešíme přímo, nýbrž prostřednictvím zpožděných potenciálů. Při analýze v kmitočtové oblasti vycházíme ze soustavy [9], [10] µ A r = 4π S ϕ () J( r ) 1 = 4πε () r σ ( r ) S exp [ jkr ] R exp R [ jkr] ds ds (.7a ) (.7b ) E s J () r + jωσ () r = 0 () r = jω A() r ϕ() r (.7c ) (.7d ) Vektorový potenciál A v bodě popsaném polohovým vektorem r počítáme dle vztahu (.7a) jako integrál proudů na povrchu antény; vektor proudové hustoty J přitom násobíme Greenovou funkcí exp( jkr)/r, kterou můžeme chápat jako jakousi funkci úměrnosti příspěvku proudu v bodě r k vektorovému potenciálu A(r). Dále ve vztahu (.7a) značí k vlnové číslo, R je vzdálenost r r a µ značí permeabilitu prostředí, do něhož je anténa umístěna. Skalární potenciál ϕ v bodě popsaném polohovým vektorem r počítáme dle vztahu (.7b) jako integrál nábojů na povrchu antény; nábojovou hustotu σ přitom násobíme Greenovou funkcí exp( jkr)/r, kterou můžeme chápat jako jakousi funkci úměrnosti příspěvku náboje v bodě r ke skalárnímu potenciálu ϕ (r). Dále ve vztahu (.7b) značí k vlnové číslo, R je vzdálenost r r a ε značí permitivitu prostředí, do něhož je anténa umístěna. Vzájemné působení nábojů a proudů je svázáno rovnicí kontinuity (.7c). Symbol ω je úhlový kmitočet, na kterém anténu analyzujeme. Ze známých potenciálů můžeme vypočíst intenzitu elektrického pole vyzářené vlny pomocí vztahu (.7d). Pro jednoduchost uvažujme drátový symetrický dipól z obr. 1.3a. Budeme předpokládat, že dipól je velmi tenký (jeho poloměr je mnohem menší než jeho délka a než délka vlnová). Potom lze použít tzv. thin-wire aproximaci, při níž předpokládáme koncentraci proudů a nábojů na ose dipólu. I když jde tato aproximace proti smyslu povrchového jevu [], získané výsledky vykazují relativně dobrou přesnost [10]. Navíc je analýza výpočetně nenáročná, neboť řešíme jednorozměrný problém. Pokud chceme anténu analyzovat v oblasti časové, nemůžeme k vyjádření fázových posuvů použít členu jkr, neboť ten je svázán se separátním kmitočtem analýzy (vlnové číslo k = π f / c je přímo úměrné kmitočtu f; c značí rychlost světla ve vakuu). Proto musíme fázové posuvy nahradit časovými zpožděními. Potom soustava rovnic (.7) přejde na tvar [18] µ = 4π 1 R (, t) J( r, t R c) ds A r S (.8a ) 14
ϕ 1 = 4πε 1 R ( r, t) σ ( r, t R c) ds J E s ( r t) ( r t) S ( r, t) σ, + = 0 t (, t) A r, = ϕ r t (, t) (.8b ) (.8c ) (.8d ) V soustavě (.8) značí c rychlost světla, t je čas a zbytek symbolů má stejný význam jako v předchozím. Při analýze dipólu v časové oblasti, tj. při řešení soustavy rovnic (.8), již neřešíme pouze jednorozměrný problém, nýbrž problém dvojrozměrný (kromě směru osy dipólu z nám přibyl čas t). Nicméně díky přenosu relevantní informace ze všech dříve vypočtených časových vzorků veličin pole do budoucího vzorku těchto veličin vykazuje momentová metoda v časové oblasti velmi dobrou efektivnost [18]. Navíc lze algoritmus numerického řešení soustavy (.8) sestavit způsobem, který eliminuje nutnost maticové inverze, jež je při analýze v kmitočtové oblasti nezbytná [10]. Proto je dobré při analýze antén v širším pásmu kmitočtů dát přednost časové analýze. E [V/m] 350 300 I [A] 1,0 0,5 50 00 150 100 50 0 0 5 10 15 0 5 30 35 n 0,0-0,5-1,0 0 40 60 80 100 10 140 160 180 Obr..4 Časový průběh velikosti intenzity budicí vlny (vlevo). Proud indukovaný v budicí štěrbině analyzovaného dipólu (vpravo). Příklad výsledků časové analýzy symetrického drátového dipólu je nakreslen na obr..4. Dipól byl ozařován rovinnou vlnou, která dopadala na anténu kolmo k její ose a jejíž elektrická intenzita byla rovnoběžná s touto osou. Časový průběh budicí vlny odpovídal Gaussovu impulsu. Tvar impulsu na obr..4 vlevo byl získán diskretizací spojitého Gaussova impulsu. Ostré špičky ve zobrazení jsou důsledkem této diskretizace a se skutečností nemají nic společného. Časový průběh proudu, který naměříme na štěrbině mezi rameny dipólu, je nakreslen na obr..4 vpravo. Je dobré si všimnout, že většina energie budicího impulsu je soustředěna do prvních 0 časových kroků. Těmto 0 krokům odpovídá první kmit ve vybuzené odezvě. Druhý kmit v této odezvě nabývá dokonce větší hodnoty nežli kmit první, avšak poté přechodný děj pomalu ustává. V časové odezvě antény na budicí impuls je uložena informace o vlastnostech antény na všech kmitočtech, které jsou obsaženy v budicím impulsu. Transformací časového průběhu proudu do kmitočtové oblasti pomocí rychlé Fourierovy transformace [3] pak lze určit všechny potřebné parametry antény na všech kmitočtech sledovaného kmitočtového pásma [4]. n.3 Závěry Na základě výše uvedených skutečností lze učinit tři zobecněné závěry: 15
Pro analýzu uzavřených struktur je výhodné využít diferenční numerické metody. U uzavřených struktur totiž známe podmínky na hranici, která tuto strukturu odděluje od vnějšího nekonečného prostoru. Pro analýzu otevřených struktur je výhodné použít integrální numerické metody, které v sobě zahrnují řešení ve všech bodech nekonečného prostoru. Problém ovšem nastává v situacích, kdy jsou v analyzované struktuře přítomny dielektrické objekty. Potom je třeba zvážit využití diferenčních numerických metod doplněných o absorpční či dokonale přizpůsobené vrstvy [5], [6]. Numerická analýza založená na přímém řešení nezjednodušených axwellových rovnic poskytuje obecně platné výsledky. Nicméně výpočetní nároky této analýzy jsou relativně vysoké. Proto bývá zapotřebí uvažovat o výpočetně střídmé aproximaci vypočtených výsledků. O řešení problému nastíněného v třetím závěru pojednává následující kapitola. 3 NEURONOVÉ ODELOVÁNÍ IKROVLNNÝCH STRUKTUR Numerické modely mikrovlnných struktur, o nichž jsem hovořili v předchozí kapitole, mají sice obecnou platnost, avšak jejich nároky na výpočetní výkon procesoru a na kapacitu paměti počítače jsou relativně vysoké. Pokud potřebujeme provést jedinou separátní analýzu určitého zařízení, lze numerickou analýzu bez výhrad doporučit. Poněkud odlišným případem je případ komplexních návrhových systémů, které slouží k vývoji mikrovlnných obvodů a antén. V těchto programech je totiž model zařízení doplněn o optimalizační modul, který se snaží změnou stavových proměnných modelu dosáhnout požadovaných parametrů zařízení. Optimalizace probíhá v iteračních krocích, kterých může být relativně mnoho [7]. Analýzu je nutno vykonávat pro každý iterační krok optimalizace znovu, aby bylo možno vyčíslit hodnotu kriteriální funkce. V komplexních návrhových systémech je popsaný problém řešen pomocí přibližných modelů, které platí jen pro relativně úzkou oblast parametrů, ale jejichž výpočetní náročnost je extrémně nízká. Přibližné modely v podstatě aproximují obecné numerické řešení nad určitou oblastí stavových proměnných. K vývoji modelů pro komplexní návrhové systémy existují dva přístupy. První přístup je založen na hledání analytického vztahu, který v sobě kromě aproximace obecného řešení může zahrnovat i zjednodušený fyzikální pohled na modelovaný komponent [8]. Vývoj takových modelů není jednoduchý. Vyžaduje totiž určitou zkušenost, fyzikální cítění, čas a intelektuální úsilí. Druhý přístup je založen na využití umělých neuronových sítí v roli obecných aproximátorů. Hlavní výhoda neuronových aproximátorů spočívá v možnosti automatizovat vývoj modelu, a tím podstatně zkrátit dobu jeho vývoje. Neuronovým modelům mikrovlnných struktur se věnují následující odstavce. 3.1 Neuronové sítě Umělé neuronové sítě jsou elektronické systémy hardwarové nebo softwarové povahy, jejichž struktura je vytvořena podle lidského mozku jako vzoru. Umělé neuronové sítě tudíž sestávají z velkého počtu jednoduchých funkčních bloků (neuronů) jednoho nebo několika málo druhů. Neurony jsou organizovány do vrstev. Výstupy všech neuronů v předchozí vrstvě jsou propojeny pomocí tzv. synopsí se vstupy neuronů v následné vrstvě [9]. 16
Každá synopse je popsána svou váhou. Touto váhou je násoben signál, který synopse přenáší z výstupu neuronu v předchozí vrstvě na vstup neuronu v následné vrstvě. Neuron všechny vynásobené vstupní signály sečte, součet zpracuje pomocí nelineární aktivační funkce a výsledek postoupí všem neuronům v následné vrstvě [9]. Synoptické váhy jsou nastavovány během tzv. procesu učení. Při učení postupně přikládáme na vstup sítě takové kombinace stavových veličin modelované struktury (tzv. vstupní vzory), pro něž známe hodnoty sledovaných parametrů (tzv. výstupní vzory). Učící algoritmus přitom mění synoptické váhy tak, aby skutečná odezva sítě na vstupní vzor odpovídala výstupnímu vzoru. Jakmile je proces učení ukončen, neuronová síť si nejen pamatuje naučené odezvy, ale je rovněž schopna aproximovat odezvy i pro mezilehlé vstupní vzory s velmi dobrou přesností. V omezeném okolí je síť schopna i relativně přesné extrapolace [9]. Z hlediska architektury (vzájemného propojení neuronů) můžeme rozdělit umělé neuronové sítě do tří velkých skupin na sítě dopředné, rekurentní a buňkové. Pro účely modelování se používají pouze první dvě zmíněné architektury, a proto se nebudeme buňkovými sítěmi zabývat [9]. 3. Dopředné neuronové modely Dopředné sítě jsou charakteristické přímým tokem signálu ze vstupů na výstupy. Díky nepřítomnosti zpětných vazeb a akumulačních prvků dopředné sítě prostě staticky zobrazují vstupní vzor (n-tici stavových proměnných) na vzor výstupní (m-tici sledovaných parametrů systému). Jako příklad si uveďme neuronový model kmitočtově selektivního povrchu, který sestává z dokonale elektricky vodivých obdélníkových elementů, jež jsou ekvidistantně rozmístěny na dielektrickém substrátu (obr. 3.1 vlevo). Taková struktura se chová na určitých kmitočtech jako celokovový odražeč a na jiných frekvencích jako dielektrický substrát bez jakýchkoliv kovových elementů [3]. Kmitočtově selektivní povrch analyzujeme pomocí momentové metody ve spektrální oblasti [30]. Výsledkem analýzy je kmitočet f, na němž se objeví první maximum modulu činitele odrazu, a kmitočty f 1 < f 3, na nichž maximum modulu činitele odrazu poklesne o 3 decibely. Pro jednoduchost budeme předpokládat, že výška kovového flíčku a a výška diskretizační buňky A jsou fixní. Při návrhu tedy můžeme měnit pouze šířku flíčku b a šířku buňky B. Vstupní vzory neuronové sítě jsou tedy tvořeny dvojicemi [b, B] a výstupní vzory trojicemi [ f 1, f, f 3 ], jak je naznačeno na obr. 3.1 vpravo. Celý prostor stavových proměnných by měl být rovnoměrně pokryt vstupními vzory. V oblastech, kde dochází k prudkým změnám sledovaných parametrů (výstupních veličin), by měl být původní rovnoměrný krok zjemněn. b y 0 a b f 1 A B f f 3 B 17
Obr. 3.1 Kmitočtově selektivní povrch sestávající z obdélníkových kovových flíčků (vlevo) a struktura neuronového modelu pro aproximaci výsledků analýzy (vpravo) Relativní chyba popsaného neuronového modelu je vykreslena na obr. 3. pro diskretizační krok b = B = 1 mm a pro zjemnění diskretizačního kroku v oblasti b < 4 mm, 7 mm> a B < 10 milimetrů, 15 mm > na 0,5 mm. Zatímco první model vykazoval chybu až 10 %, relativní chyba u druhého modelu nepřesahuje hodnotu 1,5 %. Detailní popis procedury vývoje dopředných neuronových modelů mikrovlnných komponentů lze nalézt v [31]. 3.3 Rekurentní neuronové modely Základní odlišnost rekurentních neuronových sítí ve srovnání se sítěmi dopřednými spočívá v přítomnosti zpětné vazby ve struktuře. Díky této zpětné vazbě vykazuje síť dynamické chování (na vstupní vzor reaguje v případě diskrétní realizace výstupní sekvencí) [33]. Obr. 3. Relativní chyba neuronového modelu kmitočtově selektivního povrchu při ekvidistantním rozmístění vzorů (vlevo) a při zjemnění sítě v oblasti velké chyby (vpravo) Zatímco dopředné neuronové sítě zobrazovaly vstupní vektor skalárních veličin na výstupní vektor skalárních veličin, rekurentní sítě jsou schopny zobrazit vstupní vektor sekvencí na výstupní vektor sekvencí. Dopředné neuronové sítě jsou tedy vhodné zejména k modelování mikrovlnných komponentů v kmitočtové oblasti, kdy zobrazujeme stavový vektor komponentu na parametry komponentu na určité frekvenci. Naproti tomu rekurentní sítě s výhodou využijeme při modelování komponentů v časové oblasti, kdy stavový vektor komponentu zobrazíme na vektor časových sekvencí sledovaných parametrů, nebo při širokopásmovém modelování, kdy stavový vektor komponentu zobrazujeme na vektor posloupností sledovaných parametrů na jednotlivých kmitočtech sledovaného intervalu [34], [35]. ε 0 Jako příklad využití rekurentních sítí si ukážeme vytvoření d neuronového modelu podélně homogenního stíněného w mikropáskového vedení ve vrstevnatém prostředí (obr. 3.3). h ε Pro jednoduchost uvažujeme jako proměnné pouze relativní permitivitu dielektrického substrátu ε 1 <, 4> a relativní h ε 1 t permitivitu dielektrického krytu ε <, 4>. Šířka stínicího vlnovodu je A = 1,7 mm, jeho výška je d + h = 1,7 mm, dielektrické vrstvy mají výšku h = 1,7 mm, šířka mikropás- Obr. 3.3 A Stíněné mikropáskové vedení ve vrstevnatém prostředí 18
ku má hodnotu w = 1,7 mm, tloušťka mikropásku je zanedbatelná stejně jako ztráty v dielektrických i v kovových částech vedení. Pro libovolnou kombinaci relativních permitivit z výše uvedených intervalů žádáme, aby neuronová síť vrátila sekvenci fázových konstant vedení pro kmitočty 10 až 80 GHz s krokem 10 GHz. Neuronová síť tedy bude mít dva vstupy (jeden pro relativní permitivitu substrátu, druhý pro relativní permitivitu horní dielektrické vrstvy) a jeden výstup (posloupnost fázových konstant), jak je naznačeno na obr. 3.4 vlevo. Neuronová síť je trénována pro celkem 9 vzorů (všechny kombinace permitivit ε i = 1,, 3). Relativní chyba rekurentního neuronového modelu je znázorněna na obr. 3.5 vlevo. Je vidět, že její hodnota je v celém prostoru vstupních stavových veličin nižší než, %. Pokud bychom chtěli stejný model vytvořit pomocí dopředné neuronové sítě, bude relativní chyba modelu odpovídat obr. 3.5 vpravo. Je vidět, že relativní chyba je dvojnásobná. a) b) ε1 β, β,..., β 1 N w i Σ ε c) w i w m Σ D Obr. 3.4 Rekurentní neuronový model stíněného mikropáskového vedení ve vrstevnatém prostředí: a) struktura neuronového modelu, b) dopředný neuron bez zpětné vazby, c) rekurentní neuron se zpětnou vazbou Navíc musí mít dopředná síť jeden vstup navíc (pro kmitočet), musíme vytvořit 8 více trénovacích vzorů (pro každý z kmitočtů od 10 do 80 GHz) a musíme chránit síť před přetrénováním. U přetrénované dopředné sítě pak totiž dochází ke vzniku zákmitů v průběhu výstupních veličin a tedy ke zvýšení chyby aproximace v bodech mimo trénovací vzory [31]. U rekurentních sítí k tomuto jevu nedochází [34]. Obr. 3.5 Relativní chyba neuronového modelu stíněného mikropáskového vedení ve vrstevnatém prostředí. Rekurentní model (vlevo), dopředný model (vpravo) 19
3.4 Závěry Na základě výše uvedených skutečností lze učinit dva zobecněné závěry: Zatímco pro aproximaci výsledků analýzy v kmitočtové oblasti je výhodné použití dopředných neuronových sítí, pro aproximaci výsledků časové nebo širokopásmové analýzy jsou vhodnější rekurentní neuronové sítě. Rekurentní sítě jsou podstatně méně náchylné k přetrénování. Proto není zapotřebí vyčíslovat počet efektivně využitých parametrů sítě a ladit její architekturu, jako tomu je u dopředných sítí. 4 HISTORIE A SOUČASNOST ODELOVÁNÍ IKROVLNNÝCH STRUKTUR Vývoj modelování mikrovlnných struktur lze rozdělit do tří etap. S jejich charakteristikou se seznámíme v následujících odstavcích. 4.1 Etapa raných prací První etapu etapu raných prací můžeme vymezit lety 1965 až 1980. Jednalo se o období, kdy byly k dispozici velmi omezené výpočetní výkony procesorů a velmi omezená paměť počítačů, a proto bylo možno analyzovat (z pohledu současnosti) jen velmi jednoduché mikrovlnné struktury, jako jsou např. podélně homogenní vlnovody se vzduchovou výplní nebo drátové antény umístěné ve vakuu. Při analýze těchto jednoduchých struktur, které sestávaly pouze z dokonale vodivého kovu a z vakua, však vznikly základní principy všech metod, jež v současnosti používáme pro analýzu struktur komplikovaných. R. F. Harrington [10] uvedl momentovou metodu jako univerzální postup modelování otevřených struktur, jakými jsou např. antény a odražeče. K. S. Yee [36] vymyslel geniální diskretizační mřížku pro metodu konečných diferencí v časové oblasti, díky níž jsou samočinně splněny všechny podmínky na rozhraních různých prostředí. P. P. Silvester [14] objevil pro elektrotechniku metodu konečných prvků, která byla do té doby používána zejména stavebními a strojními inženýry. J. B. Keller [37] popsal základní principy geometrické teorie difrakce, s jejíž pomocí lze numericky analyzovat např. reflektorové či aperturové antény [38]. K. K. ei a J. Van Bladel společně přivedli na svět metodu hraničních prvků [39], s jejíž pomocí lze snížit dimenzi analyzovaného problému; řešení se totiž provádí jen po hranicích struktury. Ve výčtu metod bychom mohli dlouho pokračovat. Nicméně důležitá je ta skutečnost, že v období nedostatečného výpočetního výkonu počítačů bylo vykonáno obrovské množství teoretické a fundamentální práce na numerických metodách. Tato práce byla plně zúročena v následujících etapách, kdy se výkonný hardware postupně stával samozřejmostí každé laboratoře. 4. Dielektrická etapa Druhou etapu vývoje modelování můžeme vymezit lety 1980 až 1995. Symbolicky můžeme druhou etapu nazvat etapou dielektrickou. Intenzivní pozornost byla v té době totiž věnována analýze planárních struktur (vedení, antén, odražečů), které jsou realizovány jako kovový motiv na dielektrickém substrátu. Při modelování takových struktur je třeba zajistit splnění hraničních podmínek a spojitost změny pole při přechodu z jednoho prostředí do druhého. V případě metody konečných prvků byl tento problém řešen od roku 1971 [40] do roku 1991 [5], tedy plných 0 let. 0
Velmi komplikovaná je rovněž analýza planárních antén, kdy je zapotřebí vzájemně svázat potenciály s náboji a proudy prostřednictvím tzv. dyadických Greenových funkcí [11] [13], [41], [4]. Přesné vyjádření těchto funkcí není doposud známo, nicméně máme k dispozici jejich relativně přesné aproximace, které umožňují analýzu i velmi složitých planárních struktur. Kromě prací na korektním modelování dielektrických objektů bylo velké úsilí věnováno generování diskretizačních sítí pokrývajících analyzovanou strukturu (Delaunyho triangularizace [6]), hledání vhodného vyjádření bázových funkcí pro aproximaci hledané veličiny (Rao-Wilton- Glisson basis functions [43]), vývoji efektivních algoritmů pro řešení výsledných maticových rovnic, jež jsou metodami numerické analýzy produkovány (Lanczosova metoda řešení zobecněného problému vlastních čísel [6]). Co se týká analýzy v časové oblasti, kromě metody konečných diferencí se začínají rozvíjet i další metody. Jejich hlavní čas však teprve přijde. Druhé období bychom mohli rovněž nazvat obdobím neuronovým. V popisovaném čase byly totiž znovuobjeveny umělé neuronové sítě a začaly být intenzivně využívány ve všech oblastech elektrotechniky. Oblast modelování mikrovlnných struktur nebyla výjimkou, jak je popsáno v [31] a [44]. Vzhledem k dominantnímu postavení numerické analýzy v kmitočtové oblasti byly v daném období rozvíjeny zejména dopředné neuronové sítě [33]. 4.3 Etapa časové oblasti Poslední etapu můžeme vymezit polovinou devadesátých let na dolní hranici a současností na hranici horní. Symbolicky můžeme tuto etapu nazvat etapou časové oblasti, protože se objevuje silný trend k analyzování mikrovlnných struktur v této oblasti. Tato tendence souvisí jednak s bouřlivým rozvojem širokopásmových komunikačních služeb, a jednak s vysokou vyspělostí výpočetní techniky, kterou mají výzkumná pracoviště k dispozici. Velká pozornost je věnována metodě konečných prvků v časové oblasti, momentové metodě v časové oblasti a dalším [18] až [0]. Nicméně ani vývoj metod v kmitočtové oblasti neustává. Lze sledovat silný trend k hybridizaci metod či k analýze velmi komplikovaných struktur, které obsahují anisotropní, bianisotropní či chirální materiály [7], [8], [45]. Intenzivní pozornost je rovněž věnována neuronovému modelování mikrovlnných struktur. Neuronové modelování pomalu ztrácí charakter výlučného přístupu a stává se standardní metodou používanou v mikrovlnné a anténní technice [31], [46]. Kromě dopředných neuronových modelů se rovněž začínají rychle rozvíjet modely rekurentní. Díky jejich dynamické podstatě je lze totiž s výhodou využít k aproximaci výsledků analýzy v časové oblasti a k vytváření širokopásmových modelů mikrovlnných zařízení [34], [35], [47], [48]. Zdá se, že současný rozvoj nástrojů pro modelování a návrh mikrovlnných obvodů, vedení a antén směřuje ke komplexnímu pojetí modelování zkoumaných zařízení v širších pásmech kmitočtů. Otvírá se rovněž cesta ke komplexnímu pojetí optimalizace mikrovlnných zařízení, k optimalizaci přímo v časové oblasti a k interpretaci tradičních parametrů z kmitočtové oblasti (např. parametrů impedančních či rozptylových) v doméně časové. V tuto chvíli se jedná o témata otevřená, která začínají být diskutována v několika málo pilotních článcích [49] [51]. Zda se jedná o nosnou větev vývoje či nikoliv, to ukáže čas. 1
5 LABORATOŘ NUERICKÝCH ETOD FEKT VUT V BRNĚ Numerickou analýzou mikrovlnných struktur, jejich optimalizací a neuronovým modelováním jsem se začal zabývat v roce 1995. Velmi důležitým krokem na této numerické cestě pro mě byla stáž na Université Catholique de Louvain v Louvain-la-Neuve v Belgii v letech 1996 až 1997. Během této stáže jsem pracoval zejména na metodě konečných prvků, na jejím originálním rozšíření [6], [5] a na detailním porovnání dosažených výsledků s analytickými variačními modely [53], kterým je věnována mimořádná pozornost právě na Université Catholique de Louvain. Po návratu z Belgie jsem se snažil vytvořit na VUT zázemí pro pokračování spolupráce s Université Catholique de Louvain. Díky finanční podpoře Grantové agentury České republiky, která se rozhodla financovat projekt č. 10/97/14 Analýza a návrh speciálních mikrovlnných struktur, jsem mohl založit Laboratoř numerických metod. Laboratoř v sobě soustřeďuje doktorandy a diplomanty, kteří mají hluboký zájem o řešení aktuálních problémů modelování a návrhu mikrovlnných struktur. V současné době pracuje na projektech laboratoře 5 doktorandů v prezenční formě studia, 4 diplomanti a několik mladších studentů. Z hlediska materiálního vybavení sestává laboratoř z pracovní stanice, sady výkonných PC a veškerého potřebného příslušenství. Velkou pozornost věnujeme programovému vybavení. Základní vývoj numerických modelů probíhá v ATLAB, ověřené algoritmy přepisujeme do konečné formy pomocí vývojových nástrojů Borland Delphi a Borland C++ Builder. K řešení a ověřování vlastních dílčích výpočtů využíváme komerční software jako FELAB, ENSEBLE, HFSS, SERENADE a ANSYS. Jak hardwarové tak softwarové vybavení laboratoře je postupně rozšiřováno a průběžně modernizováno. Provoz laboratoře je plně financován z grantových projektů, na jejichž řešení se členové laboratoře podílejí. Aktivity laboratoře můžeme rozdělit do tří skupin jsou to aktivity výzkumné, aktivity pedagogické a aktivity směřující k popularizaci výsledků výzkumu a vývoje. Blíže tyto aktivity popíšeme v následujících odstavcích. 5.1 Výzkumné aktivity Z badatelského hlediska lze aktivity laboratoře rozdělit do čtyř základních oblastí: 5.1.1 Numerická analýza mikrovlnných struktur Laboratoř prakticky zvládla většinu nejčastěji používaných numerických metod, a to jak z uživatelského, tak z programátorského hlediska. Rozvíjeny jsou jak metody analýzy v kmitočtové oblasti tak metody v oblasti časové. Pozornost je věnována jak integrální formulaci problému, tak formulaci diferenciální. Pro standardní metody jsou vyhledávány nové aplikační možnosti. etody jsou originálně upravovány, aby byla zvýšena jejich přesnost a efektivnost. ezi témata intenzivního zájmu patří: modelování planárních mikrovlnných vedení metodou konečných prvků v kmitočtové oblasti, např. [6], [44], [5], [53]; modelování drátových a planárních antén momentovou metodou v kmitočtové oblasti, např. [54] [56];
modelování kmitočtově selektivních povrchů momentovou metodou ve spektrální oblasti [57]; modelování speciálních mikrovlnných vedení pomocí metody konečných diferencí a metody konečných prvků v časové oblasti, využití konceptu kmitočtového přeskakování [1], []; modelování drátových antén pomocí momentové metody v časové oblasti [4], [58]. V posledních pěti letech laboratoř informovala o svých originálních výsledcích v oblasti numerické analýzy v 6 článcích v mezinárodních vědeckých časopisech, v 17 příspěvcích na mezinárodních konferencích, v monografii [44] a v ostatních publikacích. 5.1. Optimalizace mikrovlnných struktur Laboratoř zvládla většinu klasických optimalizačních metod (gradientní, newtonovské, kvazi-newtonovské atd.), a to jak z uživatelského tak z programátorského hlediska. Pozornost laboratoře je však zaměřena zejména na využití a další rozvoj netradičních optimalizačních nástrojů: vývoj modifikovaných verzí genetických a polytopních algoritmů, např. [59], [60]; teoretická práce na klasifikaci, vzájemném srovnání a dalším vývoji evolučních algoritmů; optimální propojení evolučních algoritmů (globální hledání oblastí podezřelých z minima) s klasickými optimalizačními metodami (lokální prohledávání podezřelých oblastí), např. [61], [6]; optimální propojení vhodně vybraných optimalizačních metod s vhodně zvolenými modely optimalizovaného zařízení (neuronové modely pro globální prohledávání, numerické modely pro lokální ladění); např. [31]. V posledních pěti letech laboratoř informovala o svých originálních výsledcích v oblasti optimalizace ve dvou článcích v mezinárodním časopise, v 7 příspěvcích na mezinárodních konferencích, v monografii [44] a v ostatních publikacích. 5.1.3 Neuronové modelování Laboratoř pracuje jak s dopřednými sítěmi pro modelování mikrovlnných struktur v kmitočtové oblasti, tak s rekurentními sítěmi pro modelování širokopásmových struktur a pro modelování v časové oblasti. Při vytváření modelů používáme profesionální sítě z Neural Network Toolbox ATLAB i sítě vlastní. Konkrétně se zaměřujeme na řešení následujících problémů: využití umělých neuronových sítí pro automatizovaný vývoj výpočetně nenáročných modelů mikrovlnných struktur (aproximace výsledků jejich numerické analýzy), např. [31], [63]; vývoj dynamických modelů mikrovlnných struktur pomocí rekurentních neuronových sítí, např. [34], [35], [58]. V posledních pěti letech laboratoř informovala o svých originálních výsledcích v oblasti neuronového modelování v 6 časopiseckých článcích, v 7 příspěvcích na mezinárodních konferencích, v monografiích [44] a [64] a v ostatních publikacích. 5.1.4 Objektově orientovaná implementace Jak jsme již zmínili, ověřené algoritmy implementujeme v jazyce Object Pascal pomocí vývojového nástroje Borland Delphi nebo v jazyce C++ pomocí vývojového nástroje Borland C++ Builder. 3