MODELOVÁNÍ KVALITY OVZDUŠÍ POMOCÍ KOHONENOVÝCH SAMOORGANIZUJÍCÍCH SE MAP Vladimír Olej, Per Hájek, Jiří Křupka, Ilona Obršálová Univerzia Pardubice, Fakula ekonomicko-správní, Úsav sysémového inženýrsví a informaiky, Úsav veřejné správy a práva Absrac: The paper presens a design of parameers for air qualiy modelling and he classificaion of disrics ino classes according o heir polluion. Furher, i presens a model design, daa pre-processing, he designs of various srucures of Kohonen s Self-organizing Feaure Maps (unsupervised mehods), he clusering by K-means algorihm and he classificaion. Key words: Air qualiy, modelling, Kohonen s self-organizing feaure maps, K-means algorihm, classificaion. 1 Úvod Pod pojmem znečišťování ovzduší je možné zahrnou celou škálu činnosí, při nichž dochází k vnášení láek nebo energie do amosféry. Jinými slovy, znečišťování ovzduší znamená vypoušění hmoných láek v uhém, kapalném nebo plynném skupensví z různých zdrojů do ovzduší, keré buď přímo nebo po chemických změnách negaivně ovlivňují kvaliu a složení ovzduší [4]. Ochranou ovzduší se rozumí soubor echnických i adminisraivních opaření [4], kerá přímo nebo nepřímo směřují k omezení prudkého nárůsu znečišťování ovzduší. Mezi echnická opaření se zahrnují opaření echnologická, surovinová, opimalizační či omezující. Do adminisraivních je možné zahrnou opaření legislaivní, správní, ekonomická, konrolní a další. Spolu s rosoucím znečišťováním ovzduší rose i význam jeho ochrany. Vývoj kvaliy ovzduší (klasifikaci zkoumaných oblasí o i O do říd i,j Ω podle hodno jejich znečišění) je možné uskuečňova různými meodami. Jedná se například o fuzzy inferenční sysémy [3], meody učení bez učiele [1,2] a neuro-fuzzy sysémy [3], keré jsou vhodné pro modelování vývoje kvaliy ovzduší. Neuronové síě [1,2] jsou vhodné pro schopnosi se uči, zevšeobecňova a dále modelova nelineární vzahy. Vývoj kvaliy ovzduší je možné považova za klasifikační problém, kerý lze řeši různými srukurami neuronových síí. Výsupem neuronové síě je v případě klasifikace přiřazení i-é zkoumané oblasi o i O, O={o 1,o 2,,o i,,o n } v čase do j-é řídy i,j Ω, Ω={ 1,j, 2,j,, i,j,, n,j }. V článku je uveden návrh paramerů vývoje kvaliy ovzduší, kdy jsou vybrány pouze y paramery, mezi nimiž eisují nízké korelační vzahy. Vsupní daa jsou pak reprezenovány maicí P, kde vekory p i charakerizují zkoumané oblasi o i O. Dále je uveden popis Kohonenových samoorganizujících se map (KSOM), keré jsou vhodné pro klasifikaci v om případě, když řídy i,j Ω nejsou předem známé. Původnos článku spočívá v návrhu modelu vývoje kvaliy ovzduší. Modelování je realizováno pomocí meod učení bez učiele (kombinací KSOM a algorimu K-průměrů). Závěrečná čás článku obsahuje analýzu výsledků a prezenaci klasifikace zkoumaných oblasí o i O do říd i,j Ω. 2 Návrh paramerů pro modelování vývoje kvaliy ovzduší Mezi paramery, keré je možno použí pro modelování vývoje kvaliy ovzduší paří škodliviny v ovzduší. Láky znečišťující ovzduší (škodliviny) jsou označovány jako láky vnesené do vnějšího ovzduší nebo v něm druhoně vznikající, keré buď přímo, nebo po fyzikální či chemické přeměně, popř. ve spolupůsobení s jinými lákami mají škodlivý vliv na 143
živoné prosředí. Kromě znečišťujících láek mají na výsledné znečišění ovzduší významný vliv rovněž další složky podporující znečišťování nebo zvyšující jeho účinky. Jsou o např. ozon či sluneční záření, síla a směr věru, vlhkos, lak a další. Vývoj kvaliy ovzduší ovlivňují nejen paramery ýkající se škodlivin v ovzduší, ale aké paramery meeorologické. Působení obou druhů paramerů může mí za následek zvýšení znečišění ovzduší a edy i dopad na zdraví člověka. Návrh paramerů pro modelování vývoje kvaliy ovzduší, založený na předchozí korelační analýze a doporučení významných eperů v daném oboru je uveden v Tab. 1. Tab. 1: Paramery pro modelování vývoje kvaliy ovzduší Škodliviny Meeorolo Paramery 1 = SO 2, SO 2 je oid siřičiý. 2 = O 3, O 3 je ozon. 3 = NO, NO 2 (NO ) je oid dusnaý, oid dusičiý (oidy dusíku). 4 = CO, CO je oid uhelnaý. 5 = PM 10, PM 10 je prašný aerosol (prach). 6 = SV, SV je síla věru. 7 = SmV, SmV je směr věru. 8 = T 3, T 3 je eploa 3m nad zemským povrchem. 9 = RV, RV je relaivní vlhkos. 10 = T, T je lak. 11 = SZ, SZ je sluneční záření. Na základě uvedených skuečnosí je možné navrhnou následující daovou maici P P = o o 1 o i n 1 1,1 i,1 n,1 kde o i O, O={o 1,o 2,,o i,,o n } jsou objeky (zkoumané oblasi) v čase, k je k-ý paramer v čase, i,k je hodnoa parameru k pro i-ý objek o i O, i,j je j-á řída přiřazená i-ému objeku o i O, p i =( i,1, i,2,, i,k,, i,m ) je i-ý vzor, =( 1, 2,, k,, m ) je vekor paramerů. Kvalia ovzduší (Tab. 2) slouží k hodnocení savu ovzduší na základě výsledků měření hmonosních koncenrací láek v ovzduší. Hodnocení zohledňuje možný vliv na zdravoní sav obyvaelsva [4]. Nové liminí hodnoy z nařízení vlády České republiky č. 350/2002 Sb., (č. 429/2005 Sb.), kerým se sanoví imisní limiy, podmínky a způsob sledování, posuzování, hodnocení a řízení kvaliy ovzduší, jsou uváděny spolu s příslušnými mezemi olerance zvlášť k 1,k i,k n,k m 1,m i,m n,m 1, j n, j, 144
pro ochranu zdraví a zvlášť pro ochranu vegeace a ekosysémů. Rozpylové podmínky závisí zejména na proudění vzduchu, a o v horizonálním i verikálním směru [4] (Tab. 3). Tab. 2: Kvalia ovzduší Kvalia SO 2 NO 2 CO O 3 PM 10 ovzduší 1h [µg.m -3 ] 8h [µg.m -3 ] 1h [µg.m -3 ] Velmi dobrá 0-25 0-25 0-1000 0-33 0-15 Dobrá 25-50 25-50 1000-2000 33-65 15-30 Uspokojivá 50-120 50-100 2000-4000 65-120 30-50 Vyhovující 120-250 100-200 4000-10000 120-180 50-70 Španá 250-500 200-400 10000-30000 180-240 70-150 Velmi španá >500 >400 >30000 >240 >150 Tab. 3: Rozpylové podmínky Rozpylové podmínky Dobré Mírně nepříznivé Nepříznivé Charakerisika Ve výšce do (1000-1500)m nad erénem se nevyskyuje zádržná vrsva, kerá by omezovala rozpyl škodlivin. Vyskyuje se zádržná vrsva, kerá v závislosi na rychlosi věru pod svou hranicí omezuje možnos rozpylu škodlivin, ale nesplňuje paramery nepříznivých ani dobrých rozpylových podmínek. Sav, kdy rozpyl příměsí v amosféře je éměř znemožněn a kerý v oblasi se zdroji znečišění dává předpoklad k déle rvajícímu významnému překročení imisních limiů. Teno sav rozpylových podmínek nasává, když je mohuná zádržná vrsva ve výšce do 1000m nad erénem v kombinaci se slabým nebo žádným prouděním. 3 Návrh modelu vývoje kvaliy ovzduší Navržený model realizuje modelování kvaliy ovzduší. Předzpracování da umožňuje vhodnou enviromenální inerpreaci výsledků. Pomocí meod učení bez učiele jsou objeky (zkoumané oblasi měsa Pardubice) přiřazeny do shluků. Shluky jsou označeny řídami i,j Ω. Označení shluků je založeno na popisu říd i,j Ω uvedených v Tab. 2 a Tab. 3. Předzpracování da je realizováno meodou sandardizace, čímž je dosaženo odsranění závislosi na jednokách. Z meod učení bez učiele byla na základě analýzy zvolena kombinace KSOM a algorimu K-průměrů. Navržený model klasifikace objeků o i O do říd i,j Ω je uveden na Obr. 1. Předzpracování da Návrh KSOM Algorimus K- průměrů Označení shluků Klasifikace do říd i,j Obr. 2: Model vývoje kvaliy ovzduší 145
Kohonenovy samoorganizující se mapy [2] jsou založeny na kompeiční sraegii učení. Vsupní vrsva slouží k disribuci vsupních vzorů p i, i=1,2,,n. Neurony v kompeiční vrsvě jsou reprezenany vsupních vzorů a jsou organizovány do opologické srukury. Ta určuje, keré neurony spolu sousedí. Nejprve jsou vypočeny Euklidove vzdálenosi d j mezi vzorem p i a váhami synapsí w i,j všech neuronů v kompeiční vrsvě. Je vybrán en víězný neuron s indeem j*, pro kerý je Euklidova vzdálenos d j od vzoru p i minimální. Výsup ohoo neuronu je akivní, zaímco výsupy osaních neuronů jsou neakivní. Cílem učení KSOM je aproimova husou pravděpodobnosi vsupních vekorů p i R n pomocí konečného poču reprezenanů w j R n, kde j=1,2,,s. Po nalezení reprezenanů w j je každému vzoru p i přiřazen reprezenan w j* víězného neuronu. V procesu učení je definována funkce okolí h(j*,j), kerá určuje rozsah spolupráce mezi neurony, j. kolik reprezenanů w j v okolí víězného neuronu bude adapováno, a do jaké míry. Po nalezení víězných neuronů je realizována adapace vah synapsí w i,j. Principem sekvenčního rénovacího algorimu [2] je a skuečnos, že reprezenani w j* víězného neuronu a jeho opologického okolí se posouvají směrem k akuálnímu vsupnímu vekoru p i podle vzahu i w w (' + 1) = w (') + η(')h( j*, j)[ p ( ' ) ( ' )], (1) kde η( ) (0,1) je rychlos učení. 4 Analýza výsledků Cílem modelování vývoje kvaliy ovzduší je klasifikace zkoumaných oblasí o i O v čase do říd i,j Ω podle jejich kvaliy ovzduší. Návrh srukury KSOM je založen na množsví realizovaných eperimenů. Použií KSOM vede k nalezení srukury v daech (Obr. 2a). Maice U prezenuje čvercové Euklidove vzdálenosi d mezi reprezenany w j. Algorimus K- průměrů pak realizuje shlukování naučené KSOM akovým způsobem, jak je o prezenováno na Obr. 2b. Algorimus K-průměrů paří mezi nehierarchické algorimy shlukové analýzy, kde vzory p 1,p 2,,p i,,p n (n=720) jsou přiřazeny do shluků c 1,c 2,,c i,,c q. Poče shluků q=5 je určen na základě indeů kvaliy shlukování [5]. 2a 2b Obr. 3a: Maice U reprezenující čvercové Euklidove vzdálenosi, Obr. 2b: Shlukování KSOM pomocí algorimu K-průměrů Proces shlukování je ako realizován ve dvou úrovních. Nejprve je n objeků redukováno do s reprezenanů w 1,w 2,,w s pomocí KSOM. Poom je s reprezenanů shlukováno do q shluků. Nejvěší vliv na vývoj kvaliy ovzduší měsa Pardubice má zkoumaná oblas (lokalia) (Obr. 3) a měsíc (j. roční období) (Obr. 4). 146
Obr. 3: Shlukování pomocí KSOM s využiím algorimu K-průměrů (lokaliy) Legenda: Zasávky auobusů (Cihelna (CI), Dubina (DU), Polabiny (PO), Rosice (RO), Rybiví (RY), Srnojedy (SR)), křižovaky (Palacha-Pichlova (PP), Náměsí Republiky (NR)), Lázně Bohdaneč (LB), chemická ovárna Paramo (PA). Obr. 4: Shlukování pomocí KSOFM s využiím algorimu K-průměrů (měsíce) Legenda: Měsíce, leden (Jan), únor (Feb), březen (Mar), duben (Apr), kvěen (May), červen (Jun), červenec (Jul), srpen (Aug), září (Sep), říjen (Oc), lisopad (Nov), prosinec (Dec). Každému shluku je možné přiřadi souhrnný název na základě lokali, keré v něm převládají. Může o bý např. zelená zóna (u shluku, kde převažují lokaliy jako jsou Lázně Bohnadeč nebo Srnojedy), dopravní křižovaky (Palacha-Pichlova, Náměsí Republiky) a další. Vliv roku na rozdělení shluků je minimální (hodnoy paramerů jsou v jednolivých leech podobné, zn. nedošlo k věšímu výkyvu). Vliv měsíce, ve kerém jsou paramery měřeny je u někerých shluků významný a u někerých nevýznamný. Při inerpreaci shluků se vychází z hodno všech paramerů (Obr. 5). Výsledkem inerpreace shluků je jejich zařazení do říd i,j Ω. Třídy jsou určeny pomocí kvaliy ovzduší (Tabulka 2) na základě rozmezí 147
hodno znečišťujících láek. Všech pě shluků je označeno řídami 1, 2,, 5 a jejich čenosi výskyu ak, že řída 1 reprezenuje nejméně znečišěné ovzduší a řída 5 reprezenuje nejvíce znečišěné ovzduší. Čenosi výskyu (klasifikace zkoumaných oblasí o i O do říd i,j Ω podle hodno jejich znečišění) jsou znázorněny na Obr. 6. Charakerisika shluků pomocí paramerů je popsána v Tab. 4. SO 2 O 3 SZ Obr. 5: Hodnoy paramerů 1, 2,, 11 pro reprezenany KSOM Poče oblasí 240 200 160 120 80 83 210 125 225 77 40 0 1 2 3 4 5 Třída Obr. 6: Klasifikace oblasí do říd i,j Tab. 4: Označení shluků řídami i,j podle kvaliy ovzduší Shluk 1 2 3 4 5 Paramery škodlivin a rozpylových podmínek ovzduší Dobrá kvalia, dobré rozpylové podmínky, zdravé ovzduší. Uspokojivá kvalia, mírně nepříznivé rozpylové podmínky, zdravoně přijaelné ovzduší. Vynikající kvalia, mírně nepříznivé rozpylové podmínky, zdraví příznivé ovzduší. Vyhovující kvalia, mírně nepříznivé rozpylové podmínky, ovzduší ohrožující cilivé osoby. Španá kvalia, nepříznivé rozpylové podmínky, ovzduší ohrožující celou populaci. i,j j=1,2,,5 i,2 i,3 i,1 i,4 i,5 5 Závěr Vzhledem k neznámé příslušnosi zkoumaných oblasí o i O do říd i,j Ω podle hodno jejich znečišění byla pro modelování kvaliy a ochrany ovzduší Pardubicka použia meoda učení bez učiele KSOM v kombinaci s algorimem K-průměrů. Tao meoda umožňuje nalezení dobře oddělených shluků a jejich vizualizaci. Z měření da pomocí mobilního 148
moniorovacího sysému HORIBA není možné řídy i,j Ω, do kerých oblasi paří, zjisi. V předzpracovaní da byly zjišěny korelační závislosi mezi paramery NO a NO 2. Pro další práci byl proo použi paramer NO. Z analýzy výsledků vyplývá, že znečišění vybraných lokali Pardubicka je možno zařadi do j=5 říd. Každá řída je ohodnocena kvaliou ovzduší a rozpylovými podmínkami, přičemž kvalia ovzduší je rozdělena do pěi inervalů na vynikající, dobrou, uspokojivou, vyhovující a španou a rozpylové podmínky do ří inervalů, na dobré, mírně nepříznivé a nepříznivé. Navržený model byl realizován v programovém prosředí Malab 7.1 pod operačním sysémem MS Windows XP. Poděkování Tao práce byla podporovaná vědecko-výzkumným projekem Minisersva živoního prosředí České republiky, gran číslo: SP/4i2/60/07 s názvem Indikáory pro hodnocení a modelování inerakcí mezi živoním prosředím, ekonomikou a sociálními souvislosmi. Použiá lieraura: [1] HAYKIN, S. Neural Neworks: A Comprehensive Foundaion. 2 nd ediion. New Jersey: Prenice-Hall, Inc., 1999. [2] KOHONEN, T. Self-organizing Maps. 3 rd. ediion. New York: Springer-Velag Berlin Heidelberg, 2001. [3] OLEJ, V. Modelovanie ekonomických procesov na báze výpočovej ineligencie. [Vedecká monografia], Hradec Králové: M&V, 2003. [4] Sání poliika živoního prosředí České republiky 2004-2010. Praha: Minisersvo živoního prosředí, 2004. [5] STEIN, B., MEYER ZU EISSEN, S., WISSBROCK, F. On Cluser Validiy and he Informaion Need of Users. Proc. of he In. Conf. on Arificial Inelligence and Applicaions (AIA 03), Benalmádena, Spain, (2003), pp.216-221. Konakní adresa: prof. Ing. Vladimír Olej, CSc., Ing. Per Hájek, Ph.D., doc. Ing. Jiří Křupka, Ph.D. Úsav sysémového inženýrsví a informaiky doc. Ing. Ilona Obršálová, CSc. Úsav veřejné správy a práva Fakula ekonomicko-správní Univerzia Pardubice Sudenská 84, 532 10 Pardubice email: vladimir.olej@upce.cz, per.hajek@upce.cz, jiri.krupka@upce.cz, ilona.obrsalova@upce.cz el.: +420 466 036 004 149