ANALÝZA CHEMICKÉHO PŘÍHŘEVU OCELI PROSTŘEDNICTVÍM REGRESE A UMĚLÝCH NEURONOVÝCH SÍTÍ ANALYSIS OF CHEMICAL REHEATING OF STEEL BY MEANS OF REGRESSION AND ARTIFICIAL NEURAL NETWORKS Ondřej Zimný a Jan Morávka b Zora Jančíková a a VŠB-TU Ostrava, Tř.17 Listopadu 15, 708 33 Ostrava - Poruba, ČR, zora.jancikova@vsb.cz, ondrej.zimny.fmmi@vsb.cz b Materiálový a metalurgický výzkum, s.r.o., Pohraniční 693/31, 706 02 Ostrava - Vítkovice, ČR, jan.moravka@mmvyzkum.cz Abstrakt Metalurgické procesy patří mezi složité fyzikálně-chemické procesy teoreticky popsatelné pomocí vícerozměrných obecně nelineárních dynamických systémů s různými dopravními zpožděními v jejich struktuře. Před realizací praxí požadované úlohy řízení těchto systémů je potřebné provést jejich strukturální a parametrickou identifikaci. Jelikož jde o procesy velmi složité a komplexní, nejsou doposud známé všechny exaktní vztahy pro jejich matematický popis. Některé metalurgické systémy jsou zatím prakticky nepopsané (tzv. černá skřínka), další popsané pouze částečně (tzv. šedá skřínka), zatímco jen velice málo z nich je popsaných téměř úplně (tzv. bílá skřínka). Zjišťování vnitřní struktury nedostatečně popsaných systémů se děje prostřednictvím fyzikálního modelování, prostřednictvím měření důležitých veličin a následně pomocí regresní analýzy či umělých neuronových sítí aplikovaných na měřená data. Při identifikaci systémů pomocí metod statistické analýzy je určitá šance dopátrat se jejich vhodné vnitřní struktury (tj. přejít od černé skřínky k šedé, či od šedé k bílé), i když tento přístup je velice náročný na znalosti a čas. Identifikace pomocí umělých neuronových sítí umožňuje spíše vnější popis systémů (tj. vytvoření modelů černých skřínek), kdy dostáváme přijatelnou shodu mezi skutečnými a modelovanými výstupy, čili tzv. estimaci (odhad, predikci) výstupu. Tento přístup je tedy vhodnější spíše k řízení než k samotné identifikaci. Příspěvek se zabývá možnostmi predikce teploty po chemickém příhřevu oceli na zařízení integrovaného systému sekundární metalurgie pomocí regresní analýzy i umělých neuronových sítí a porovnáním obou těchto přístupů. Abstract Metallurgical processes belong to complex physical-chemical processes theoretically described by means of multidimensional generally nonlinear dynamic systems with different transfer lags in their structure. Before realization of these systems control requested by practice it is necessary to execute their structural and parametric identification. As these processes are very complex, all exact relations for their mathematical description are not known so far. Some metallurgical systems are practically non-described so far (black box), further described only partially (grey box), while only a little of them are described 1
almost fully (white box). Determination of internal structure of insufficiently described systems is done by means physical modeling, by measurement if important data and subsequently by means of regression analysis or artificial neural networks applied to measured data. There is certain chance to determine a proper system internal structure at system identification by means of statistical analysis (i.e. to come from black box to grey box or from grey box to white box), though this approach is knowledge and timeconsuming. Identification by means of artificial neural networks enables rather external system description (i.e. black box models creation), when we get an acceptable accordance between real and modeled outputs, i.e. so called output estimation (prediction). This approach is thus more suitable for control than for identification itself. Contribution deals with a possibility of prediction of a temperature after a steel chemical heating on device of integrated system of secondary metallurgy by means of regression analysis and artificial neural networks and with a comparison of both of these approaches. 1. ÚVOD Cílem tohoto článku je prezentovat odhad i porovnání hodnot predikované výstupní teploty oceli po chemickém příhřevu pomocí regresní analýzy (RA) a umělých neuronových sítí (UNS). Pokud je kesonové zařízení vybaveno kyslíkovou trysku, naskýtá se příležitost provedení chemického příhřevu. Proces chemického příhřevu lze stručně shrnout následujícím popisem: Operátor vychází z příchozí teploty Tepl_hom. Na základě této teploty mu počítač doporučí množství hliníku (Al), kyslíku (O2) a oxidu vápenatého (CaO). Nejprve je vnesen hliník, poté se začne foukat kyslík a bezprostředně po vyjetí kyslíkové trysky se přidá oxid vápenatý. Tyto prvky spolu souvisí, podle příchozí teploty je vneseno do tavby dané množství hliníku, úměrně tomu je přidáno množství kyslíku a také oxidu vápenatého. Mimo vnesený hliník dochází rovněž k spalování ostatních prvků rozpuštěných v oceli včetně železa. Významný teplotní přínos představují především prvky, jako jsou mangan (Mn), křemík (Si), hliník (Al) a uhlík (C). Výstupní proměnná Tepl_2 je měřena na konci chemického příhřevu po ukončení foukání kyslíku. S ohledem na klasifikaci systémů v abstraktu lze konstatovat, že analyzovaný chemický příhřev patří do skupiny částečně popsaných procesů, takže jde o tzv. šedou skřínku. Cílem analýzy je zvýšit informaci o struktuře a vazbách tohoto procesu, tzn. přiblížit se ke struktuře tzv. bílé skřínky. Pro analýzu byla použita data získaná z ocelárenského závodu sekundární metalurgie. Proměnné využité k analýze jsou uvedeny v Tabulce 1. 2
Tabulka 1. Analyzované proměnné Table 1. Analyzed variables Proměnná Veličina Hmot_FLS hmotnost tavby [kg] Před_Odp_Tepl odpichová teplota [ C] Uprav_Odp_Tepl upravená odpichová teplota [ C] Čas_Oxyvit_ISSM doba, která uplynula od konce odpichu do spuštění vakuového zpracování [s] Doba_Vak doba vakuování [s] Tepl_Hom teplota po homogenizaci na zařízení ISSM [ C] Doba_Odp_FLS skutečná doba odpichu tavby z konvertoru [s] Doba_Mer_Hom_Chp doba mezi dvěma měřeními, a to před procedurou VOH (Vacuum Oxygen Heating) a po ní [s] Del_Tepl_Mer_Hom_Chp změna teploty před VOH a po VOH [ C] Del_Si_Hom_Chp snížení množství křemíku při VOH [kg] Del_Mn_Hom_Chp snížení množství manganu při VOH [kg] Tepl_Efekt_Si teplotní efekt způsobený křemíkem [ C] Tepl_Efekt_Mn teplotní efekt způsobený manganem [ C] Del_Al_Hom_Chp přísada hliníku [kg] Tepl_Efekt_Al teplotní efekt způsobený hliníkem [ C] Sum_Tep_Ef_AlSiMn celkový teplotní efekt v důsledku oxidace hliníku, křemíku a manganu [ C] del_tep_cao změna teploty oceli způsobená vápnem [ C] O2_AlSiMn stechiometrická potřeba plynného kyslíku na oxidaci hliníku, křemíku a manganu při VOH [Nm 3 /t] O2_SiMn stechiometrická potřeba plynného kyslíku na oxidaci křemíku a manganu při VOH [Nm 3 /t] O2_Mer měrná spotřeba kyslíku na příhřev [Nm 3 /t] Al_Mer měrná spotřeba hliníku na příhřev [kg/t] kyslík spotřeba kyslíku [Nm 3 ] CaO spotřeba oxidu vapenatého v [kg] Tepl_2 teplota po chemickém příhřevu [ C] výstup Z tabulky 1 vyplývá, že pro analýzu bylo k dispozici 23 vysvětlujících proměnných a jedna vysvětlovaná, či výstupní proměnná (Tepl_2). 2. UMÉLÉ NEURONOVÉ SÍTĚ Umělé neuronové sítě (UNS) jsou vhodné pro aproximaci vztahů mezi různými procesními daty, zejména pak mezi daty nestrukturovanými s vysokým stupněm nelinearity a daty nepřesnými a Prahování neúplnými. X 1 W 0 W 1 UNS využívají distribuované paralelní zpracování informace při X 2 Y W 2 + provádění výpočtů, tzn., že Agregace ukládání, zpracování a předávání X 3 W 3 informace probíhá prostřednictvím Soma Synapse celé neuronové sítě. Obr. 1. Neuron jako matematický procesor Fig. 1. Neuron as a mathematic processor Základem matematického modelu UNS je formální neuron, který lze získat přeformulováním zjednodušené funkce neuronu 3
neurofyziologického do matematických vztahů. Neuronová buňka se skládá z mnoha části, z nichž čtyři následující lze považovat za základní. Jedná se o synapse, soma, dendrity a axon - obr.1. Formální neuron má n obecně reálných vstupů x 1,, x n odpovídající dendritům. Všechny vstupy jsou ohodnoceny příslušnými synaptickými váhami w 1,, w n. Váhy určují míru propustnosti vstupního signálu. Zvážena suma vstupních hodnot představuje vnitřní potenciál neuronu. Operace probíhající v neuronu můžeme rozdělit na operace synaptické a somatické. Do operací synaptických patří konfluence z (t) = x (t) w (t) i i i Do operací somatických patří agregace n u(t) = z (t) i = 1 prahování v(t) = u(t) - w 0 i a nelineární zobrazení v(t) y(t) = 1/(1+e ) (4) Výstup neuronu y, modelující elektrický impuls axonu, je dán obecně nelineární přenosovou funkcí, jejímž argumentem je vnitřní potenciál. Pokud vnitřní potenciál neuronu překoná prahovou hodnotu, dojde k excitaci neuronu na hodnotu danou příslušnou přenosovou funkcí. Pro všechny typy predikcí se v podstatě hodí UNS, které jsou univerzálními aproximátory funkcí, tedy zejména sítě, využívající pro své učení algoritmus zpětného šíření (Back-propagation). 2.1. Predikce teploty pomocí umělých neuronových sítí Získaná data byla nejprve upravena a vytříděna. Na základě upravených dat a vybraných vstupních proměnných byly vytvářeny modely UNS. Jako vstupní proměnné byly použity: hmotnost tavby, teploty před chemickým příhřevem, doba vakuování, hmotnosti chemických prvků hliníku, manganu, křemíku, oxidu vápenatého a množství kyslíku (tj. 11 vysvětlujících proměnných). Jako hodnota predikovaná je určená proměnná teplota po chemickém příhřevu. Zobecněná bloková struktura vstupů a výstupu umělé neuronové sítě je zobrazena na obr.2. Schéma vytvořené sítě je na obr.3. (1) (2) (3) 4
Typ sítě Obr. 2. Bloková struktura neuronové sítě Fig. 2. Block structure of neural network Obr. 3. Struktura umělé neuronové sítě Fig. 3. Structure of artificial neural network K vytváření a analýze umělých neuronových sítí byl použit komerční program Statistica-Neuronové sítě. V tomto programu bylo vytvořeno několik modelů. Jako výsledný model byl vybrán ten, který měl nejlepší parametry vyjadřující míru nepřesnosti mezi skutečnými a předikovanými hodnotami. Vybraný model představuje třívrstvou neuronovou síť, která má 11 neuronů ve vstupní vrstvě, 5 ve skryté vrstvě a jeden neuron ve výstupní vrstvě. Parametry vybrané sítě byly implementovány do samostatného programu, nezávislém na programu Statistica. Tento program umožňuje na základě zadání vstupních hodnot predikovat teplotu po chemickém příhřevu a změnu teploty, kterou chemický příhřev způsobí. Na obr.4,5 jsou zobrazeny grafy s výsledky, které byly získané z vytvořené UNS. 1640 1620 Porovnání predikované a měřené teploty Měřená hodnota Predikovaná hodnota 240 220 200 180 Histogram 1600 160 140 Tepl_2 C 1580 120 100 1560 1540 1520 0 100 200 300 400 500 600 700 800 počet případů Počet pozorování 80 60 40 20 0-45 -40-35 -30-25 -20-15 -10-5 0 5 10 15 20 25 30 Rezidua Obr. 4. Porovnání predikované a měřené teploty Fig. 4. Comparison of predicted and measured temperature Obr. 5. Histogram reziduí UNS Fig. 5. Histogram of residues of ANN První graf zobrazuje rozdíl mezi měřenou a předikovanou hodnotou výstupní teploty proměnné Tepl_2 v závislosti na počtu případů. Na druhém grafu (obr. 5) je zobrazen histogram reziduí. Z tohoto grafu je patrné, že většina predikovaných hodnot se liší od změřených hodnot v teplotním rozmezí do ±5 C. Pro vyjádření a porovnání míry nepřesnosti mezi skutečnými hodnotami a predikovanými hodnotami UNS nebo RA lze použít tři univerzální a základní parametry kvality predikce modelů: SSE, RMS a R 2. 5
Pro vybranou umělou neuronovou síť, uvedenou výše, jsou porovnávací parametry a jejich hodnoty následující: SSE - (Sum of squared error) součet čtverců chyb n 2 SSE = (yi oi ) (5) i= 1 SSE = 21714,772 kde je n y i o i - počet vzorů trénovací nebo testovací množiny, - predikované hodnoty výstupu neuronové sítě, - skutečné hodnoty výstupu objektu. RMS - (Root Mean Squared) střední kvadratická (standardní, směrodatná) chyba regrese n 2 (yi o i) i=1 RMS = n 1 (6) RMS = 5,58564 R 2 - koeficient (pro nelineární modely index) determinace SSE R 2 = 1 (7) SST R 2 = 0,875796 kde je SSE - součet čtverců chyb SST - celkový součet čtverců chyb Na obr.6 je viditelné okno vytvořeného programu, umožňující uživateli po zadání příslušných vstupních proměnných vypočítat predikovanou (dopředu odhadovanou) výstupní teplotu po chemickým příhřevu. Dojde i k výpočtu změny teploty, tedy k výpočtu rozdílů teploty před a po chemickém příhřevu. Obr. 6. Program pro predikci teploty po chemickém příhřevu Fig. 6. Program for prediction of temperature after chemical reheating Na základě těchto informací lze naplánovat délku následných operací při zpracování oceli na zařízení sekundární metalurgie. Popřípadě lze měnit vstupní parametry tak, aby bylo dosaženo žádané výstupní hodnoty, a to ještě před 6
samotným procesem chemického příhřevu. 3. REGRESNÍ ANALÝZA Regresní analýza byla nejprve aplikována na všechna data (taveb) a s uvažováním všech dostupných regresorů (tj. 23 vysvětlujících proměnných podle tabulky 1) za předpokladu jejich lineárního (aditivního) působení na regresand (výstupní proměnnou). Pomocí bohaté regresní diagnostiky však bylo zjištěno, že: mezi některými regresory existují silné korelační vazby, některé záznamy (tavby) vykazují vybočující hodnoty. Prostřednictvím ukazatele VIF (Variance Inflation Factor) a mnohorozměrové analýzy dat (metoda hlavních komponent) byly z množiny regresorů odstraněny ty, které byly významně závislé na ostatních. Tímto krokem obsahovala podmnožina regresorů pouze dominantní, ovlivňující (a už ne ovlivňované) a vzájemně téměř nezávislé (ortogonální) vysvětlující proměnné. Z množiny dat byly odstraněny záznamy s vybočujícími hodnotami v tavbách. Takto upravená podmnožina regresorů a dat byla východiskem jak pro analýzu pomocí UNS, tak i pomocí vícenásobné regrese (RA). Po konzultaci s technology byla podmnožina regresorů ještě upravena na 11 regresorů - viz obr. 2. 3.1. Úplný vícenásobný lineární regresní model Pro vybranou podmnožinu 11 regresorů a dat bez vybočujících záznamů byl použit úplný (se všemi regresory) vícenásobný lineární regresní model (LRMU), který má obecný tvar: m y = b0 + b1 x1 +... + b11 x11 + ε = b0 + b j x j + ε, (8) kde je y b 0 b j x j ε m j= 1 - regresand (vysvětlovaná proměnná), - absolutní člen (konstanta), - regresní (vazební, váhové) koeficienty, - regresory (vysvětlující proměnné), - chyba regrese, reziduum, - počet regresorů. Regresní diagnostika výsledků aplikace tohoto modelu (LRMU) ukázala, že model je sice vysoce statisticky významný, v čase stabilní, s prakticky nekolineárními regresory, avšak 4 z nich, tj. Uprav_odp_tepl, Doba_Vak, Del_Mn_hom_chp a CaO se (překvapivě) jevily jako statisticky nevýznamné. Model není lineární (chybí mu nelinearity regresorů typu mocnina, inverzní funkce - hyperbola, či logaritmus), o čemž do jisté míry svědčí i statisticky významný absolutní člen. Model je statisticky nekorektní, protože jeho rezidua vykazují všechny nectnosti - heteroskedasticitu (přímou i autoregresně podmíněnou), nenormalitu a autokorelaci. Prakticky to znamenalo, že model potřeboval úpravu ve dvou směrech: 1. Analýza nelinearity regresorů a jejich zavedení do modelu 2. Odstranění statisticky nevýznamných (neovlivňujících, přebytečných ) regresorů. 3.2. Redukovaný transformovaný vícenásobný regresní model Regresní diagnostika, jako i komponentní a reziduální grafy ukázaly, že je vhodné u proměnné Doba_Vak přidat její kvadrát, u proměnné Doba_Mer_Hom_Chp její převrácenou hodnotu, přidat interakci (součin) proměnných Hmot_FLS a CaO, jako i odstranit vliv dvou vybočujících bodů (taveb). 7
Po těchto úpravách vykazoval model (LRMT) některé statisticky nevýznamné regresory (hmotnost tavby, upravená odpichová teplota a snížení množství manganu při VOH), které byly postupně odstraněny pomocí tzv. krokové (stepwise) metody se zpětným (backward) výběrem (významných) regresorů. Výsledný redukovaný model s transformovanými 10ti regresory (LRMTR) vykazoval statisticky dobré vlastnosti. Jeho index determinace (tzv. regresní rabat) R 2 = 87,5 % je prakticky stejný jako u UNS, hodnoty SSE a RMS jsou dokonce nižší. Na obr.7,8 jsou viditelné graf predikce a histogram reziduí výsledného regresního modelu LRMTR. Z obou grafů je zřejmé, že model LRMTR přijatelně predikuje výstupní teplotu chemického příhřevu. Jeho rezidua vykazují normální rozdělení se směrodatnou odchylkou asi 5 C. Obr. 7. Porovnání predikované a měřené teploty Fig. 7. Comparison of predicted and measured temperature Obr. 8. Histogram reziduí modelu LRMTR Fig. 8. Histogram of residues from model LRMTR 3. ZÁVĚR Cílem článku bylo prezentovat možnosti predikce teploty po chemickém příhřevu oceli na zařízení integrovaného systému sekundární metalurgie pomocí regresní analýzy (RA) i umělých neuronových sítí (UNS) a porovnání obou přístupů. Výsledky analýzy, jako i možnosti, přednosti a nedostatky (silné a slabé stránky) obou přístupů jsou stručně a přehledně shrnuty v tabulce 2: Tabulka 2. Porovnání přístupů analýzy Table 2. Comparison of analysis methods Objekt RA UNS Poznámka Koeficient determinace R 2 [%] 87,5 87,6 UNS lepší Součet čtverců reziduí SSE [ C 2 ] 19 279 21 715 RA lepší Směrodatná chyba regrese RMS [ C] 5,31 5,59 RA lepší Počet regresorů 11 / 10 11 RA věrnější Přístupnost hodnot vazebních koeficientů ano ano v programu UNS Diagnostika vlivnosti (významnosti) vstupů ano ano Diagnostika adekvátnosti modelu ano ne Diagnostika přeurčenosti modelu ano ano je i v UNS Diagnostika korektnosti modelu ano ne Diagnostika reziduí modelu ano ne 8
Z uvedeného porovnání je vidět, že UNS jsou obecně vhodné spíše k predikci výstupu než k určení adekvátní struktury a přenosových koeficientů procesu. LITERATURA [1] JANČÍKOVÁ, Z. Umělé neuronové sítě v materiálovém inženýrství. Monografie, GEP ARTS Ostrava, 2006. ISBN 80-248-1174-X. [2] KRAYZEL, M. Technologie mimopecního zpracování na zařízení ISSM, technická zpráva, Vítkovice, a. s., 2007. [3] JANČÍKOVÁ, Z., ROUBÍČEK, V., JUCHELKOVÁ, D. Application of Artificial Intelligence Methods for Prediction of Steel Mechanical Properties. Metalurgija, 47 (2008) 2, s. 133-137, ISSN 0543-5846. 9