Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Licenční studium Statistické zpracování dat Semestrální práce Klasifikace analýzou vícerozměrných dat (Diskriminační analýza, Logistická regrese, Vícerozměrného škálování a Korespondenční analýzu) 2007 Jindřich Freisleben
OBSAH 1. KLASIFIKACE OBJEKTŮ PODZEMNÍCH VOD NA ZÁKLADĚ HODNOT ANALYZOVANÝCH UKAZATELŮ... 3 1.1 ZADÁNÍ... 3 1.2 KRITIKA DAT... 4 1.3 NALEZENÍ DISKRIMINAČNÍHO MODELU (Z ANALYZOVANÉHO VÝBĚRU)... 8 1.4 KLASIFIKACE OBJEKTŮ... 9 1.5 ZÁVĚR... 11 2. NALEZENÍ STATISTICKY VÝZNAMNÝCH UKAZATELŮ PŘISPÍVAJÍCÍCH K SEPARACI OBJEKTŮ PODZEMNÍCH VOD DO 2 SKUPIN... 12 2.1 ZADÁNÍ... 12 2.2 KRITIKA DAT... 13 2.3 NALEZENÍ LOGISTICKÉHO MODELU... 14 2.4 VLASTNÍ KLASIFIKACE OBJEKTŮ PREDIKOVANÉ HODNOTY... 17 2.5 ZÁVĚR... 18 3. POROVNÁNÍ VYBRANÝCH STÁTŮ EVROPSKÉ UNIE NA ZÁKLADĚ HODNOT ZÁKLADNÍCH UKAZATELŮ ZNEČIŠTĚNÍ OVZDUŠÍ... 19 3.1 ZADÁNÍ... 19 3.2 KLASICKÉ METRICKÉ VÍCEROZMĚRNÉ ŠKÁLOVÁNÍ (CMDS)... 20 3.3 NEMETRICKÉ VÍCEROZMĚRNÉ ŠKÁLOVÁNÍ (NNMDS)... 23 3.4 KORESPONDENČNÍ ANALÝZA (CA)... 26 3.5 ZÁVĚR... 29 LITERATURA A SOFTWARE... 30 PŘÍLOHY... 31 2
1. Klasifikace objektů podzemních vod na základě hodnot analyzovaných ukazatelů 1.1 Zadání V rámci monitoringu jakosti podzemních vod existují 3 základní kategorie sledovaných objektů (prameny, mělké vrty a hluboké vrty). Pokusíme se s využitím metody diskriminační analýzy (DA) zjistit u nezařazených analytických rozborů základních ukazatelů nejpravděpodobnější typ objektu podzemních vod, kde byly vzorky odebrány. 1.1.1 Data Data (viz. Příloha) jsou rozděleny na dva stejně velké výběry: Analyzovaný výběr (slouží k návrhu modelu) a klasifikovaný výběr (slouží k otestování navrženého modelu). Závisle proměnná: Typ objektu (TO) může nabývat 3 hodnot (0 = pramen, 1 = mělký vrt, 2 = hluboký vrt) 16 nezávisle proměnných (znaků, diskriminátorů): ph. ph vody v laboratoři K konduktivita v laboratoři [ms/m] T teplota vody [ C] R oxidačně redukční potenciál [mv] A absorbance (254nm,1cm) M celková mineralizace [mg/l] O2 kyslík rozpuštěný [mg/l] CHSKMn chemická spotřeba kyslíku manganistanem [mg/l] KNK4,5 kyselinová neutralizační kapacita do ph 4,5 [mmol/l] ZNK8,3 zásadová neutralizační kapacita do ph 8,3 [mmol/l] NH4 amonné ionty [mg/l] NO2 dusitany [mg/l] NO3 dusičnany [mg/l] PO4 fosforečnany [mg/l] Cl chloridy [mg/l] SO4 sírany [mg/l] 3
1.2 Kritika dat 1.2.1 Průzkumová analýza diskriminátorů Tabulka 1: Základní charakteristiky diskriminátorů [2] aritmetický průměr směrodat. odchylka medián šikmost špičatost počet objektů TO ph K T R A M O2 CHSKMn KNK4.5 ZNK8.3 NH4 NO2 NO3 PO4 Cl SO4 P 0 6.71 37.5 9.5 188 0.016 282 8.8 0.7 2.05 0.62 0.03 0.008 21.5 0.10 13.1 53.9 MV 1 6.83 97.6 10.9 43 0.079 730 2.6 2.3 4.71 1.32 0.51 0.037 29.5 0.19 58.9 199.2 HV 2 7.07 46.4 10.8-25 0.028 344 3.5 0.9 3.30 0.77 0.26 0.015 11.1 0.11 23.8 38.3 P 0 0.73 29.7 1.2 115 0.015 232 2.0 0.6 2.18 0.51 0.04 0.028 29.3 0.11 13.6 48.1 MV 1 0.50 66.0 1.7 123 0.074 579 2.2 2.0 3.87 0.84 1.11 0.055 40.0 0.37 48.8 288.8 HV 2 0.73 38.9 2.8 119 0.047 232 3.3 1.0 2.24 0.65 0.74 0.025 26.3 0.16 57.4 70.0 P 0 6.97 28.0 9.5 185 0.013 205 9.2 0.5 0.81 0.51 0.03 0.003 11.5 0.06 6.5 42.3 MV 1 6.97 77.8 10.6 46 0.055 580 2.0 1.7 4.61 1.14 0.09 0.014 5.8 0.08 49.0 109.5 HV 2 7.17 35.8 10.1-28 0.015 285 2.0 0.5 3.03 0.55 0.05 0.005 0.5 0.04 8.4 20.5 P 0-0.3 1.0 0.1 3.2 2.6 1.2-1.4 2.7 1.0 2.1 5.2 6.0 3.2 2.4 1.5 2.3 MV 1-1.4 2.0 2.6 0.4 2.6 2.5 1.5 1.8 3.7 1.1 4.4 3.3 1.4 4.5 1.7 4.2 HV 2-0.2 2.1 2.9 0.0 6.0 1.8 0.9 2.6 0.7 0.9 4.8 3.4 3.8 2.9 4.8 5.4 P 0-1.3 0.3-0.5 20.4 7.3 1.3 2.9 8.4-0.3 4.9 31.5 36.3 14.2 7.3 1.5 6.9 MV 1 2.5 5.1 8.8-0.3 9.9 8.4 2.2 3.8 22.3 0.8 24.5 14.7 0.7 22.7 4.6 20.6 HV 2 0.5 5.1 10.4 0.0 45.0 5.9-0.6 6.8 0.3-0.3 23.9 14.1 18.1 8.8 23.6 34.8 P 0 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 MV 1 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73 HV 2 89 89 89 89 89 89 89 89 89 89 89 89 89 89 89 89 Základním předpokladem diskriminační analýzy (DA) je platnost vícerozměrné normality v rámci tříd, nutnou (ne však postačující) podmínkou je normální rozdělení dat pro jednotlivé diskriminátory. Normální rozdělení v rámci základních charakteristik se projevuje blízkými hodnotami aritmetického průměru a mediánu, šikmost blízká 0 popř. špičatost blízká 3. Z tohoto hlediska není normalita splněna u všech znaků. Nejmarkantnější odchylky od normality se objevují u těchto ukazatelů: A, NH4, NO2, NO3, PO4, Cl a SO4. Z ohledem na to je nutné si uvědomit, že data v této úloze by bylo vhodné zpracovat jinou metodou např. Logistickou regresí. Dalším předpokladem DA je podobnost kovariačních matic tříd. Z tohoto vyplývá předpoklad přibližně stejně velkých směrodatných odchylek v rámci jednotlivých tříd. Větší rozdíly jsou u znaků: K, M, Cl a SO4. Nejdůležitější vlastností diskriminátoru je zda dostatečně přispívá k separaci objektů mezi třídami. To lze předpokládat na základě rozdílných hodnot průměrů v rámci jednotlivých tříd. Z ohledem na tuto vlastnost lze předběžně za nevhodné diskriminátory označit: ph, T, CHSKMn, PO4, ale ani další se nejeví ideálně. Zdá se, že lze docílit dobré separace mezi třídou MV (mělké vrty) a ostatními, ale pravděpodobnost pro správné zařazení objektů mezi třídami P (prameny) a HV (hluboké vrty) bude zřejmě nižší. 4
1.2.2 Korelace Tabulka 2: Korelační matice znaků [2] ph K T R A M O2 CHSKMn KNK4.5 ZNK8.3 NH4 NO2 NO3 PO4 Cl SO4 ph 1 K 0.30 1 T 0.19 0.27 1 R -0.30-0.16-0.26 1 A -0.07 0.29 0.08-0.18 1 M 0.30 0.94 0.26-0.10 0.24 1 O2-0.15-0.30-0.35 0.61-0.32-0.30 1 CHSKMn -0.12 0.29 0.10-0.24 0.83 0.21-0.36 1 KNK4.5 0.44 0.75 0.32-0.29 0.17 0.76-0.36 0.17 1 ZNK8.3-0.29 0.40 0.20-0.18 0.42 0.29-0.33 0.50 0.38 1 NH4 0.14 0.34 0.15-0.23 0.20 0.26-0.27 0.33 0.38 0.24 1 NO2 0.02 0.36 0.06-0.07 0.36 0.35-0.22 0.29 0.16 0.18 0.05 1 NO3 0.00 0.35 0.00 0.30 0.02 0.30 0.24-0.08 0.09 0.04-0.08 0.19 1 PO4 0.00 0.06-0.02-0.06 0.58 0.04-0.12 0.52 0.07 0.14 0.17 0.23 0.06 1 Cl 0.16 0.74 0.19-0.21 0.27 0.57-0.26 0.37 0.42 0.34 0.40 0.23 0.23 0.04 1 SO4 0.07 0.79 0.12 0.01 0.26 0.80-0.16 0.20 0.32 0.24 0.08 0.44 0.26-0.01 0.46 1 Dalším důležitým předpokladem pro metodu diskriminační analýzy je, že v datech není multikolinearita, tedy 2 a více diskriminátorů nejsou silně korelovány. Jinak totiž lze predikovat jeden diskriminátor z jiného. Není vhodné zejména při užití krokové metody. Silná korelace je mezi diskriminátory: M, K, KNK4.5 M, K a SO4 K a Cl A a CHSKMn Středně silná korelace je mezi diskriminátory: R a O2 A a PO4 M a Cl CHSKMn a ZNK8.3 CHSKMn a PO4 5
Graf 1: Maticový diagram silně korelované diskriminátory [2] Maticový graf jen potvrzuje naše hodnocení dat a diskriminátorů u předchozích dvou tabulek. Sledované znaky K, M, KNK4.5, SO4 a Cl lze nahradit jediným z důvodu silné korelace mezi nimi. Stejně tak dvojici znaků A a CHSKMn lze nahradit ze stejného důvodu jediným. U žádného z bodových grafů nelze pozorovat dělení mraku bodů na více shluků, tedy nelze předpokládat že by mezi nimi byl diskriminátor s dobrou separační schopností objektů do tříd. Zároveň tvary většiny histogramů ukazují spíše na rozdělení log-normální. 6
Graf 2: Maticový diagram ostatní diskriminátory [2] V maticovém diagramu znaků s nižšími korelacemi se jeví jako nejvhodnější diskriminátor O2, v histogramu je patrné bimodální rozdělení a v bodových grafech kombinací znaků O2 s ph a O2 s ZNK8.3 se mrak bodů trhá na více shluků. Naproti tomu rozdělení znaků NH4, NO2 a NO3 vykazuje jasné zešikmení k nižším hodnotám, což nás vede k závěru o jejich nevhodnosti pro užití v metodě diskriminační analýzy. 1.2.3 Závěr ke kritice dat Vzhledem k silné korelaci mezi některými znaky a výraznému zešikmení rozdělení u některých dalších, zredukujeme jejich počet. V další analýze budeme již využívat pouze tyto diskriminátory: K, CHSKMn, ph, T, R, O2, ZNK8.3 a NO3. 7
1.3 Nalezení diskriminačního modelu (z analyzovaného výběru) 1.3.1 Vyšetření vlivu diskriminátorů Tabulka 3: Výběr vhodných diskriminátorů[2] Wilks. Lambda Parc. Lambda F na vyj (2,223) Úroveň p Toler. 1-toler. R^2 O2 0.398423 0.685260 51.21191 0.000000 0.736068 0.263932 K 0.302355 0.902991 11.97860 0.000011 0.714172 0.285828 R 0.321021 0.850486 19.60156 0.000000 0.734109 0.265892 CHSKMn 0.309517 0.882094 14.90375 0.000001 0.871373 0.128627 NO3 0.293753 0.929432 8.46580 0.000286 0.692731 0.307270 ph 0.278427 0.980594 2.20659 0.112473 0.795092 0.204909 T 0.272216 0.997041 0.329379 0.719722 0.908415 0.091585 ZNK8.3 0.273014 0.999966 0.003738 0.996269 0.635727 0.364273 krok 6, počet proměnných v modelu: 6; grupovací proměnná: TO (3 skupiny); Wilks. lambda: 0.27302 přibliž F (12,446)=33.963 p<0.0000 V rámci diskriminační analýzy byla užita kroková analýza dopředná. V šesti krocích byly nalezeny znaky s dostatečnou diskriminační silou. Vyřazení znaků, které nenáleží do modelu se provádí s využitím Wilkova kritéria λ, které nabývá hodnot od 0 (výborná diskriminační síla) do 1 (žádná diskriminační síla). Wilkova λ v tabulce odpovídají hodnotě při vypuštění daného znaku, pokud jsou větší než je příslušná hodnota Wilkova kritéria λ (v této analýze 0.27302) znamená to, že vypuštěný diskriminátor patří do modelu. Znaky s dostatečnou diskriminační silou jsou: O2, K, R, CHSKMn, NO3 a ph. 1.3.2 Klasifikační funkce Tabulka 4: Klasifikační funkce [2] G_1:0 (prameny) p = 0.29870 G_2:1 (mělké vrty) p = 0.31602 G_3:2 (hluboké vrty) p = 0.38528 O2 1.3009 0.3850 0.5943 K -0.0663-0.0532-0.0768 R 0.0311 0.0278 0.0197 CHSKMn 2.8078 3.4001 2.5659 NO3-0.0161 0.0214 0.0101 ph 19.2652 18.8572 19.5694 absolutní člen -74.0416-68.3263-70.3839 Tabulka obsahuje odhady neznámých diskriminačních koeficientů klasifikační funkce, která slouží k zařazování nových objektů do tříd. Veličina p je apriorní pravděpodobnost, to je pravděpodobnost, že bude objekt zařazen do dané třídy. 8
1.4 Klasifikace objektů 1.4.1 Klasifikační matice Tabulka 5: Klasifikační matice [2] % správně zařazených objektů G_1:0 (prameny) G_2:1 (mělké vrty) G_3:2 (hluboké vrty) G_1:0 (prameny) 79.71 55 6 8 G_2:1 (mělké vrty) 58.11 6 43 25 G_3:2 (hluboké vrty) 73.86 13 10 65 Celkem 70.56 74 59 98 Ověření navržené diskriminační funkce se provádí klasifikací objektů u nichž víme do jaké třídy náleží (klasifikovaný výběr). Z ohledem na hodnoty procentuálního vyjádření správně zařazených objektů v jednotlivých třídách je navržený model nejméně účinný při klasifikaci objektů mělkých vrtů. Naopak nejnižší procento chybně zařazených objektů je v třídě pramenů. 1.4.2 Chybně zařazené objekty Tabulka 6: Přehled chybně zařazených objektů - Mahalanobisovy vzdálenosti [2] typ objektu prameny mělké vrty hluboké vrty typ objektu prameny mělké vrty hluboké vrty PO0016 pramen 9.698 4.786 1.644 VP0635 mělký vrt 6.399 3.417 2.490 PO1835 pramen 17.363 9.850 4.089 VP0651 mělký vrt 9.942 4.876 4.802 PO4006 pramen 8.249 14.974 7.015 VP0672 mělký vrt 8.421 8.126 6.412 PP0053 pramen 9.737 11.258 5.708 VP0692 mělký vrt 6.148 3.436 3.533 PP0111 pramen 14.104 5.417 10.392 VP0714 mělký vrt 3.736 16.204 11.627 PP0115 pramen 5.296 9.733 2.998 VP1324 mělký vrt 6.173 9.011 10.633 PP0148 pramen 5.252 6.905 4.942 VP1576 mělký vrt 10.079 3.321 3.441 PP0331 pramen 17.615 12.406 16.491 VP1601 mělký vrt 4.721 4.943 6.788 PP0378 pramen 14.869 11.176 13.815 VP1721 mělký vrt 5.245 5.807 7.768 PP0434 pramen 5.856 2.948 6.044 VP1724 mělký vrt 9.828 3.860 3.690 PP0462 pramen 3.692 4.851 1.088 VP1942 mělký vrt 3.181 8.175 5.416 PP0496 pramen 38.041 33.869 45.964 VP1966 mělký vrt 7.935 5.487 0.952 PP0513 pramen 33.262 16.923 31.375 VP7005 hluboký vrt 13.630 7.218 8.409 PP0540 pramen 5.642 5.791 4.272 VP7012 hluboký vrt 4.010 8.956 5.321 VB0031 mělký vrt 9.320 2.022 1.715 VP7016 hluboký vrt 3.042 10.424 5.187 VB0078 mělký vrt 6.185 2.706 2.861 VP7215 hluboký vrt 30.313 16.356 20.667 VB0095 mělký vrt 10.635 2.474 2.592 VP7304 hluboký vrt 3.645 8.186 4.267 VB0117 mělký vrt 8.789 3.808 2.155 VP7510 hluboký vrt 5.368 13.504 8.337 VB0236 mělký vrt 10.151 4.194 3.842 VP7524 hluboký vrt 2.309 5.912 4.914 VB0271 mělký vrt 11.236 2.662 2.874 VP7614 hluboký vrt 21.540 8.523 12.936 VB0295 mělký vrt 9.757 2.121 2.393 VP7618 hluboký vrt 36.057 20.343 28.961 VB0322 mělký vrt 11.183 3.914 1.626 VP7710 hluboký vrt 12.251 6.125 11.142 VB0401 mělký vrt 1.646 5.213 4.547 VP7716 hluboký vrt 4.634 11.720 9.472 VB9754 hluboký vrt 33.323 15.267 24.906 VP7718 hluboký vrt 7.515 9.895 11.220 VO0005 mělký vrt 12.131 4.289 2.474 VP7720 hluboký vrt 3.920 13.556 9.810 VO0016 mělký vrt 9.205 3.652 3.991 VP7722 hluboký vrt 1.774 15.629 11.226 VO0089 mělký vrt 14.551 10.366 4.293 VP7727 hluboký vrt 2.484 7.468 4.257 VP0007 mělký vrt 13.070 4.038 2.020 VP7800 hluboký vrt 14.021 7.638 9.839 VP0094 mělký vrt 4.121 2.745 2.811 VP8206 hluboký vrt 22.375 9.310 20.565 VP0119 mělký vrt 4.004 5.373 4.276 VP8419 hluboký vrt 29.351 16.416 20.705 VP0210 mělký vrt 12.544 3.138 2.518 VP8456 hluboký vrt 2.099 12.261 7.926 VP0326 mělký vrt 11.529 1.909 2.186 VP8503 hluboký vrt 6.447 17.620 17.062 VP0478 mělký vrt 12.811 2.879 2.488 VP9500 hluboký vrt 2.145 8.778 3.702 VP0485 mělký vrt 48.752 37.122 31.262 VP9506 hluboký vrt 45.671 28.198 38.944 9
Tabulka obsahuje Mahalanobisovy vzdálenosti klasifikovaných objektů od Z skóre jednotlivých tříd. Objekt je zařazen do třídy, ke které je nejblíže. Vlivem toho že shluky objektů v rámci jednotlivých tříd se částečně prolínají, dochází k chybným zařazením objektů z jedné třídy, které jsou blíže k centru (Z-skóre) třídy jiné. Tabulka 7: Přehled chybně zařazených objektů - Aposteriorní pravděpodobnosti [2] typ objektu prameny mělké vrty hluboké vrty typ objektu prameny mělké vrty hluboké vrty PO0016 pramen 0.0117 0.1439 0.8444 VP0635 mělký vrt 0.0675 0.3175 0.6150 PO1835 pramen 0.0010 0.0439 0.9551 VP0651 mělký vrt 0.0321 0.4273 0.5406 PO4006 pramen 0.2918 0.0107 0.6975 VP0672 mělký vrt 0.1740 0.2133 0.6128 PP0053 pramen 0.0896 0.0443 0.8661 VP0692 mělký vrt 0.1013 0.4159 0.4828 PP0111 pramen 0.0110 0.8980 0.0910 VP0714 mělký vrt 0.9737 0.0020 0.0243 PP0115 pramen 0.1929 0.0222 0.7849 VP1324 mělký vrt 0.7170 0.1835 0.0994 PP0148 pramen 0.3368 0.1559 0.5073 VP1576 mělký vrt 0.0148 0.4587 0.5265 PP0331 pramen 0.0569 0.8143 0.1288 VP1601 mělký vrt 0.4157 0.3935 0.1907 PP0378 pramen 0.1011 0.6780 0.2209 VP1721 mělký vrt 0.4620 0.3691 0.1688 PP0434 pramen 0.1492 0.6757 0.1751 VP1724 mělký vrt 0.0201 0.4210 0.5589 PP0462 pramen 0.1579 0.0936 0.7485 VP1942 mělký vrt 0.6627 0.0577 0.2796 PP0496 pramen 0.1048 0.8926 0.0026 VP1966 mělký vrt 0.0213 0.0766 0.9020 PP0513 pramen 0.0003 0.9988 0.0009 VP7005 hluboký vrt 0.0224 0.5847 0.3929 PP0540 pramen 0.2203 0.2162 0.5635 VP7012 hluboký vrt 0.5686 0.0507 0.3807 VB0031 mělký vrt 0.0101 0.4087 0.5812 VP7016 hluboký vrt 0.6814 0.0180 0.3006 VB0078 mělký vrt 0.0723 0.4358 0.4919 VP7215 hluboký vrt 0.0008 0.8755 0.1237 VB0095 mělký vrt 0.0074 0.4618 0.5308 VP7304 hluboký vrt 0.4867 0.0532 0.4601 VB0117 mělký vrt 0.0203 0.2587 0.7210 VP7510 hluboký vrt 0.7631 0.0138 0.2231 VB0236 mělký vrt 0.0192 0.3997 0.5811 VP7524 hluboký vrt 0.6556 0.1145 0.2299 VB0271 mělký vrt 0.0062 0.4739 0.5199 VP7614 hluboký vrt 0.0012 0.8806 0.1182 VB0295 mělký vrt 0.0100 0.4796 0.5104 VP7618 hluboký vrt 0.0004 0.9835 0.0161 VB0322 mělký vrt 0.0051 0.2061 0.7888 VP7710 hluboký vrt 0.0386 0.8746 0.0868 VB0401 mělký vrt 0.6756 0.1201 0.2043 VP7716 hluboký vrt 0.8731 0.0267 0.1002 VB9754 hluboký vrt 0.0001 0.9901 0.0097 VP7718 hluboký vrt 0.6561 0.2112 0.1327 VO0005 mělký vrt 0.0046 0.2475 0.7478 VP7720 hluboký vrt 0.9290 0.0079 0.0630 VO0016 mělký vrt 0.0282 0.4790 0.4928 VP7722 hluboký vrt 0.9877 0.0010 0.0113 VO0089 mělký vrt 0.0044 0.0377 0.9579 VP7727 hluboký vrt 0.6177 0.0541 0.3283 VP0007 mělký vrt 0.0024 0.2296 0.7680 VP7800 hluboký vrt 0.0269 0.6923 0.2808 VP0094 mělký vrt 0.1790 0.3767 0.4444 VP8206 hluboký vrt 0.0014 0.9943 0.0044 VP0119 mělký vrt 0.3760 0.2007 0.4234 VP8419 hluboký vrt 0.0013 0.8739 0.1248 VP0210 mělký vrt 0.0032 0.3744 0.6224 VP8456 hluboký vrt 0.9289 0.0061 0.0650 VP0326 mělký vrt 0.0037 0.4832 0.5131 VP8503 hluboký vrt 0.9898 0.0039 0.0063 VP0478 mělký vrt 0.0026 0.4018 0.5956 VP9500 hluboký vrt 0.6133 0.0235 0.3631 VP0485 mělký vrt 0.0001 0.0420 0.9579 VP9506 hluboký vrt 0.0002 0.9942 0.0056 Jiným způsobem klasifikace objektů do tříd je využití hodnot aposteriorních pravděpodobností. Objekt je přidělen ke třídě, pro níž je hodnota pravděpodobnosti vyšší. Je zajímavé, že oba uvedené způsoby klasifikace vedly k chybnému zařazení týchž objektů, přestože u některých došlo k zařazení do odlišné nesprávné třídy. 1.4.3 Zařazení neznámých objektů Tabulka 8: Klasifikace neznámých objektů - Mahalanobisovy vzdálenosti [2] klasifikace prameny mělké vrty hluboké vrty 1 pramen 3.627 13.512 13.302 2 pramen 2.910 15.066 14.378 3 pramen 3.070 12.565 11.550 4 pramen 1.486 13.679 9.964 5 pramen 1.191 6.951 5.874 6 hluboký vrt 8.061 3.202 2.449 7 hluboký vrt 7.190 2.705 2.296 8 mělký vrt 23.034 10.948 16.066 9 mělký vrt 8.530 2.846 4.835 10 mělký vrt 8.356 2.820 6.657 11 hluboký vrt 10.700 5.841 3.338 12 mělký vrt 21.231 9.151 13.130 13 hluboký vrt 7.299 6.209 4.007 14 mělký vrt 15.186 8.192 9.140 10
1.5 Závěr Data z chemických analýz nebyla shledána jako vhodná pro dostatečně přesné přiřazení objektů podzemních vod s využitím metody lineární diskriminační analýzy (LDA) ke třem základním skupinám. Zvláště procento správně zařazených objektů v rámci třídy mělkých vrtů je dost nízké (pouze 58 %). Příčina může být jednak v tom, že monitorované ukazatele nemají dostatečnou diskriminační sílu a rovněž to že většina z nich vykazuje jiné než normální rozdělení. 11
2. Nalezení statisticky významných ukazatelů přispívajících k separaci objektů podzemních vod do 2 skupin 2.1 Zadání Užitím metody logistické regrese určete, u kterých stanovovaných ukazatelů chemického rozboru vody lze výši jejich hodnot pro dva základní typy objektů podzemních vod (prameny a vrty) považovat za statisticky významně rozdílné. 2.1.1 Data Data v příloze: Tabulka I: Analyzovaný výběr objekty podzemních vod Závisle proměnná: Typ objektu (TO2) může nabývat 2 hodnot (P = pramen, V = vrt) 16 nezávisle proměnných (znaků, diskriminátorů): ph. ph vody v laboratoři K konduktivita v laboratoři [ms/m] T teplota vody [ C] R oxidačně redukční potenciál [mv] A absorbance (254nm,1cm) M celková mineralizace [mg/l] O2 kyslík rozpuštěný [mg/l] CHSKMn chemická spotřeba kyslíku manganistanem [mg/l] KNK4,5 kyselinová neutralizační kapacita do ph 4,5 [mmol/l] ZNK8,3 zásadová neutralizační kapacita do ph 8,3 [mmol/l] NH4 amonné ionty [mg/l] NO2 dusitany [mg/l] NO3 dusičnany [mg/l] PO4 fosforečnany [mg/l] Cl chloridy [mg/l] SO4 sírany [mg/l] 12
2.2 Kritika dat 1.2.1 Korelace Tabulka 9: Korelační matice prediktorů [2] Abs. 1 Abs. ph K T R A M O2 CHSKMn KNK4.5 ZNK8.3 NH4 NO2 NO3 PO4 Cl SO4 ph -0.88 1 K -0.12 0.07 1 T -0.36-0.02-0.08 1 R -0.19 0.19 0.03-0.13 1 A 0.17-0.10-0.15-0.14-0.18 1 M -0.25 0.22-0.19 0.00-0.20 0.07 1 O2-0.29-0.01 0.12 0.17-0.06-0.03 0.16 1 CHSKMn -0.12 0.01 0.07 0.08 0.22-0.76 0.00 0.15 1 KNK4.5 0.35-0.32-0.90 0.06 0.03 0.11-0.20-0.14-0.02 1 ZNK8.3-0.66 0.66 0.14-0.08 0.00-0.04 0.54 0.25-0.01-0.44 1 NH4 0.11-0.02-0.29-0.20 0.15 0.27-0.04 0.00-0.31 0.27-0.13 1 NO2 0.20-0.16-0.17-0.05-0.12 0.01 0.03-0.06-0.13 0.16-0.12 0.10 1 NO3 0.15-0.08-0.88 0.06 0.03 0.01-0.04-0.25 0.04 0.87-0.23 0.24 0.11 1 PO4-0.04-0.06-0.02 0.12 0.06-0.24-0.16 0.11 0.15 0.09-0.05-0.13-0.27 0.05 1 Cl 0.25-0.13-0.80-0.08-0.11 0.23 0.10-0.14-0.27 0.73-0.25 0.41 0.23 0.58-0.05 1 SO4 0.12-0.08-0.89 0.14 0.07 0.03-0.18-0.15 0.02 0.93-0.26 0.18 0.11 0.90 0.11 0.62 1 Většina metod vícerozměrné analýzy je založena na platnosti různých předpokladů o datech, což snižuje věrohodnost výsledků při zpracování dat, která taková omezení nesplňují. Výhodou metody logistické regrese je, že nemusí být splněny určité předpoklady o datech zejména o jejich rozdělení (tedy ani obvyklá podmínka vícerozměrné normality). Z tohoto důvodu je logistická regrese v určitých případech alternativou k metodě nejmenších čtverců či diskriminační analýze. To nám ovšem nebrání v tom, abychom si prohlédly, které prediktory spolu silněji korelují. 13
2.3 Nalezení logistického modelu 2.3.1 Iterační přiblížení odhadů parametrů prediktorů Tabulka 10: Iterační výsledky [2] Iterace 0 Iterace 1 Iterace 2 Iterace 3 Iterace 4 Iterace 5 Iterace 6 Iterace 7 Iterace 8 Iterace 9 Abs.člen 0.000-1.3576-2.3148-3.1313-4.7939-6.4251-7.2273-7.3038-7.3096-7.3102 ph 0.000-0.0968-0.1195-0.1003 0.0729 0.2185 0.2830 0.2800 0.2794 0.2794 K 0.000 0.0162 0.0531 0.1145 0.1732 0.2077 0.2323 0.2392 0.2391 0.2391 T 0.000-0.0196-0.0438-0.0951-0.1151-0.0881-0.0633-0.0540-0.0524-0.0523 R 0.000 0.0034 0.0070 0.0100 0.0122 0.0129 0.0128 0.0128 0.0128 0.0128 A 0.000-4.9892-12.1531-22.9408-37.3807-48.7670-55.1354-56.1885-56.2430-56.2449 M 0.000-0.0010-0.0023-0.0034-0.0046-0.0047-0.0045-0.0046-0.0046-0.0046 O2 0.000 0.2768 0.3792 0.4438 0.4691 0.4886 0.4937 0.4951 0.4951 0.4951 CHSKMn 0.000 0.1183 0.3143 0.5639 0.8770 1.1579 1.3278 1.3530 1.3544 1.3545 KNK4.5 0.000-0.0188-0.1703-0.5589-0.9880-1.2872-1.5282-1.5731-1.5715-1.5713 ZNK8.3 0.000-0.1002-0.1108-0.0165 0.1715 0.3957 0.5272 0.5237 0.5222 0.5222 NH4 0.000-0.0522-0.1793-0.3613-0.7117-1.8840-3.3054-3.7931-3.8912-3.8962 NO2 0.000-0.6267-2.7440-5.2227-7.1512-9.0281-9.9546-10.0266-10.0091-10.0080 NO3 0.000-0.0126-0.0223-0.0317-0.0356-0.0387-0.0425-0.0434-0.0434-0.0434 PO4 0.000 0.3933 0.7444 1.1237 1.4840 1.9343 2.1462 2.1682 2.1687 2.1688 Cl 0.000-0.0049-0.0181-0.0462-0.0843-0.1105-0.1266-0.1303-0.1302-0.1302 SO4 0.000-0.0008-0.0044-0.0111-0.0156-0.0182-0.0202-0.0208-0.0208-0.0208 Věrohodnost -160.117-75.9854-60.2415-53.9824-51.3445-50.4265-50.1499-50.1232-50.1223-50.1223 Zjemňování odhadů parametrů v průběhu iteračního postupu vede ke zvyšování hodnoty věrohodnosti. 2.3.2 Krokové zavádění prediktorů do logistického regresního modelu Tabulka 11: Věrohodnostní test typu 1 [2] Stupně volnosti Ln- věrohod. Chí- kvadrát p Abs. člen 1-140.855 ph 1-137.549 6.61082 0.010136 K 1-128.385 18.32867 0.000019 T 1-121.011 14.74776 0.000123 R 1-78.718 84.58542 0.000000 A 1-73.449 10.53806 0.001169 M 1-72.498 1.90221 0.167831 O2 1-59.485 26.02670 0.000000 CHSKMn 1-58.014 2.94075 0.086371 KNK4.5 1-56.477 3.07536 0.079487 ZNK8.3 1-56.400 0.15249 0.696164 NH4 1-55.814 1.17361 0.278662 NO2 1-55.736 0.15447 0.694300 NO3 1-54.790 1.89196 0.168981 PO4 1-54.364 0.85199 0.355991 Cl 1-50.748 7.23369 0.007155 SO4 1-50.122 1.25055 0.263447 14
Tabulka 12: Věrohodnostní test typu 3 [2] Stupně volnosti Ln- věrohod. Chí- kvadrát p ph 1-50.1999 0.15521 0.693607 K 1-52.2354 4.22621 0.039804 T 1-50.1533 0.06213 0.803160 R 1-59.1469 18.04931 0.000022 A 1-53.5483 6.85199 0.008854 M 1-50.5381 0.83156 0.361822 O2 1-60.6336 21.02262 0.000005 CHSKMn 1-52.2695 4.29449 0.038236 KNK4.5 1-51.1309 2.01727 0.155519 ZNK8.3 1-50.3024 0.36033 0.548325 NH4 1-51.5926 2.94061 0.086378 NO2 1-50.6813 1.11811 0.290327 NO3 1-51.7537 3.26283 0.070867 PO4 1-50.5336 0.82259 0.364425 Cl 1-53.9882 7.73184 0.005426 SO4 1-50.7476 1.25055 0.263447 Tabulka 13: Waldův test významnosti odhadů parametrů [2] Stupně volnosti Wald. Stat. p Abs. člen 1 1.89172 0.169008 ph 1 0.15723 0.691717 K 1 3.59111 0.058089 T 1 0.05762 0.810305 R 1 14.13257 0.000170 A 1 5.16597 0.023034 M 1 0.83862 0.359792 O2 1 15.08386 0.000103 CHSKMn 1 4.52561 0.033391 KNK4.5 1 1.91392 0.166528 ZNK8.3 1 0.36298 0.546857 NH4 1 1.65239 0.198634 NO2 1 1.20186 0.272951 NO3 1 2.82244 0.092955 PO4 1 0.95384 0.328743 Cl 1 6.95741 0.008347 SO4 1 1.15389 0.282735 Waldův test významnosti prediktorů je považován za nejlepší pro velké výběry dat (tj. optimálně alespoň 20 objektů na 1 testovaný prediktor, minimálně 10 objektů na 1 prediktor), což v našem případě platí, proto vezmeme za rozhodující výsledky Waldova testu. Waldova statistika představuje čtverec poměru odhadu regresního koeficientu a jeho směrodatné odchylky. Pro významné parametry platí, že hodnota pravděpodobnosti p je nižší než hladina 0.05, s kterou počítáme. Statisticky významné prediktory jsou: R (oxidačně-redukční potenciál) A (absorbance při λ 256 nm) O2 (kyslík rozpuštěný) CHSKMn (Chemická spotřeba kyslíku manganistanem) Cl (chloridy) 15
Tabulka 14: odhady parametrů a intervaly spolehlivosti odhadů [2] Odhad Dolní LS 95. % Horní LS 95. % Standard chyba Abs.člen -7.3102-17.727 3.10693 5.31494 ph 0.2794-1.102 1.66045 0.70463 K 0.2391-0.008 0.48637 0.12617 T -0.0523-0.480 0.37506 0.21807 R 0.0128 0.006 0.01946 0.00340 A -56.2449-104.746-7.74341 24.74613 M -0.0046-0.014 0.00526 0.00504 O2 0.4951 0.245 0.74497 0.12748 CHSKMn 1.3545 0.107 2.60238 0.63670 KNK4.5-1.5713-3.797 0.65480 1.13578 ZNK8.3 0.5222-1.177 2.22097 0.86674 NH4-3.8963-9.837 2.04447 3.03104 NO2-10.0080-27.900 7.88438 9.12891 NO3-0.0434-0.094 0.00723 0.02584 PO4 2.1688-2.184 6.52129 2.22068 Cl -0.1302-0.227-0.03346 0.04937 SO4-0.0208-0.059 0.01716 0.01938 Pokud mezi horní a dolní mezí intervalu spolehlivosti odhadů parametrů leží 0, pak je parametr statisticky nevýznamný. Pokud interval spolehlivosti 0 neobsahuje je parametr významný. Závěry o významnosti parametrů v této tabulce se dobře shodují s výsledky Waldova testu. 2.3.3 Těsnost proložení logistickým modelem Tabulka 15: Testy těsnosti proložení [2] SV Stat. Stat/sv deviance 214 100.2446 0.468433 Deviance v měřítku 214 100.2446 0.468433 Pearsonův chí^2 214 187.0646 0.874134 P. chí^2 v měř. 214 187.0646 0.874134 Log-věrohodnost -50.1223 16
2.4 Vlastní klasifikace objektů predikované hodnoty 2.4.1 Klasifikace Tabulka 16: Chybně klasifikované známé objekty [2] Odezva '1' = P Před. Hodnota Lineár. Před. Směrod. Chyba Dolní LS 95. % Horní LS 95. % PB0371 1 0.223854-1.2433 1.58316 0.012789 0.865250 PO0017 1 0.044451-3.0679 0.97176 0.006878 0.238071 PP0051 1 0.376636-0.5039 0.68549 0.136180 0.698399 PP0121 1 0.327158-0.7211 0.75786 0.099172 0.682291 PP0277 1 0.491018-0.0359 0.59015 0.232792 0.754127 PP0437 1 0.080485-2.4358 0.68050 0.022543 0.249361 PP0456 1 0.343192-0.6491 0.58731 0.141826 0.622929 PP0466 1 0.439801-0.2420 0.68056 0.171386 0.748739 PP0853 1 0.401865-0.3977 0.73649 0.136910 0.739967 VP0715 0 0.984306 4.1387 1.03954 0.891021 0.997926 VP0814 0 0.694826 0.8228 1.02113 0.235306 0.943967 VP1994 0 0.560697 0.2440 0.79015 0.213380 0.857252 VP7008 0 0.797464 1.3705 0.64574 0.526199 0.933152 VP7214 0 0.710397 0.8973 0.93163 0.283201 0.938386 VP7508 0 0.812820 1.4684 0.61704 0.564404 0.935705 VP7513 0 0.601238 0.4106 0.55959 0.334890 0.818676 VP7525 0 0.680757 0.7573 0.79325 0.310562 0.909866 VP8420 0 0.971080 3.5139 0.92828 0.844816 0.995195 VP8424 0 0.627981 0.5236 0.73439 0.285811 0.876851 VP8431 0 0.698333 0.8394 0.72312 0.359413 0.905223 VP8505 0 0.659023 0.6589 0.45700 0.441085 0.825584 Odezva představuje skutečnou příslušnost objektu do dané třídy (1 = P tedy pramen a 0 = V tedy vrt) a Před. Hodnota je vypočtená hodnota závisle proměnné, pokud je mezi 0 až 0.5 pak je objekt přiřazen do třídy 0 (vrt), pokud je mezi 0.5 až 1, pak je objekt zařazen do třídy 1 (pramen). Z 69 pramenů bylo chybně zařazeno 9. Ze 162 vrtů bylo chybně zařazeno 12. Graf 3: P-graf reziduí [2] 17
V ideálním případě leží body v P-grafu rezidují těsně na přímce. Pokud tomu tak není je to důkaz toho, že nalezený model je přeurčený (redundantní), tedy obsahuje více proměnných než potřebujeme. 2.5 Závěr Metodou Logistické regrese byl nalezen model: TO2 = 7,310 + 0,279 ph + 0,239 K 0,052 T + + 0,013 R 56,245 A 0,0046 M + 0,495 O2 + 1,355 CHSKMn 1,571 KNK4.5 + 0,522 ZNK8.3 3,896 NH4 10,008 NO2 2,169 PO4 0,1302 Cl 0,021 SO4. Jako statisticky významné byly na základě Waldova testu shledány tyto parametry: R, A, O2, CHSKMn a Cl. Klasifikací známých objektů bylo chybně přiřazeno 21 ze 321 objektů (tj. 6,5 %) 18
3. Porovnání vybraných států Evropské unie na základě hodnot základních ukazatelů znečištění ovzduší 3.1 Zadání Aplikací metod vícerozměrného škálování (MDS) a korespondenční analázy (CA) nalezněte podobnost mezi vybranými státy EU s ohledem na míru znečišťujících látek v ovzduší a spotřebu primárních energetických zdrojů v roce 2003. 3.1.1 Data Tabulka 17: Data [3] CZ SK PL HU AT DE BE PT EU15 sox 22.20 19.00 37.70 35.30 4.40 7.40 14.80 28.40 14.20 nox 32.30 19.00 20.60 17.70 24.50 17.20 28.20 27.80 24.30 nh3 8.10 5.60 8.50 6.60 6.70 7.30 7.40 8.90 8.50 co2 11.80 7.20 7.60 5.50 8.30 10.30 11.10 6.10 11.00 tzl 8.80 10.80 11.70 7.40 8.90 9.80 9.60 9.40 9.40 data odpovídají roku 2003 sox nox nh3 co2 tzl CZ SK PL HU AT DE BE PT EU15 emise oxidů síry [kg/obyvatele] emise oxidů dusíky [kg/obyvatele] emise amoniaku [kg/obyvatele] emise skleníkových plynů [t/obyvatele] tuhé znečišťující látky [kg/obyvatele] Česká republika Slovensko Polsko Maďarsko Rakousko Dánsko Belgie Portugalsko průměr první 15 členů EU 19
3.2 Klasické metrické vícerozměrné škálování (CMDS) 3.2.1 Nalezení počtu souřadnic (dimenzí) Tabulka 18: Vyšetření vlastních čísel [4] Pořadové číslo Jednotlivé Kumulativní Čárový diagram dimenze Vlastní číslo procento procento vlastních čísel 1 2.46 90.18 90.18 IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 2 0.17 6.11 96.28 III 3 0.06 2.36 98.65 I 4 0.04 1.35 100.00 I 5 0.00 0.00 100.00 6 0.00 0.00 100.00 7 0.00 0.00 100.00 8 0.00 0.00 100.00 9 0.00 0.00 100.00 Součet 2.73 Nejostřejší zlom v čárovém diagramu vlastních čísel je u druhé dimenze, tedy otimální počet dimenzí (souřadnic) jsou 2. První 2 dimenze vysvětlují 96,28 % proměnlivosti v datech. Což je zcela postačující. 3.2.2 Optimalizace výpočtu vzdáleností a těsnost proložení Tabulka 19: Vyčíslení kritéria stress [4] Počet Čtverec dimenzí reziduí Stress Pseudo R 2 1 0.246273 0.010024 95.42 2 0.099994 0.004070 98.14 3 0.018305 0.000745 99.66 4 0.000000 0.000000 100.00 Počet vzdáleností 36 Průměr vzdáleností 0.730048 Suma čtverců vzdáleností 24.567509 Suma čtverců vzdáleností okolo jejich průměru 5.380591 Hodnota kritéria stress ukazuje na kvalitu proložení dat modelem. Kvalita proložení je dobrá, jestliže stress < 0,05 a výborná pro stress < 0,01. Pseudo R 2 ukazuje na procento sumy čtverců vzdáleností pro příslušný počet dimenzí. Hodnota vyšší než 80 % je velmi dobrá. Hodnoty stress a Pseudo R 2 pro vybrané 2 dimenze dávají předpoklad výborného proložení modelem. 20
Tabulka 20: Těsnost proložení statistickou analýzou reziduí [4] Skutečná Vypočtená Relativní Řádek Sloupec vzdálenost vzdálenost Rezidum rezidum [%] 7 BE 9 EU15 0.050413 0.029695 0.020718 41.10 3 PL 4 HU 0.076123 0.018064 0.058059 76.27 5 AT 6 DE 0.197280 0.026268 0.171012 86.69 1 CZ 9 EU15 0.241074 0.239003 0.002072 0.86 1 CZ 7 BE 0.271740 0.265473 0.006267 2.31 2 SK 8 PT 0.279646 0.092173 0.187473 67.04 1 CZ 8 PT 0.441495 0.404757 0.036737 8.32 1 CZ 2 SK 0.475576 0.381619 0.093957 19.76 3 PL 8 PT 0.485946 0.466434 0.019512 4.02 6 DE 7 BE 0.489170 0.485695 0.003475 0.71 5 AT 7 BE 0.489913 0.468360 0.021553 4.40 4 HU 8 PT 0.494422 0.465405 0.029017 5.87 5 AT 9 EU15 0.515347 0.497879 0.017468 3.39 6 DE 9 EU15 0.523924 0.515320 0.008604 1.64 2 SK 3 PL 0.528444 0.473055 0.055390 10.48 2 SK 4 HU 0.567155 0.475550 0.091605 16.15 8 PT 9 EU15 0.648863 0.632273 0.016589 2.56 2 SK 9 EU15 0.649490 0.592705 0.056786 8.74 2 SK 7 BE 0.652709 0.612036 0.040673 6.23 7 BE 8 PT 0.671673 0.654418 0.017255 2.57 1 CZ 5 AT 0.742535 0.724526 0.018009 2.43 1 CZ 6 DE 0.745630 0.739252 0.006379 0.86 1 CZ 3 PL 0.856408 0.854571 0.001837 0.21 1 CZ 4 HU 0.857377 0.856666 0.000710 0.08 2 SK 6 DE 1.037159 1.018008 0.019151 1.85 2 SK 5 AT 1.047523 1.010347 0.037176 3.55 3 PL 9 EU15 1.060671 1.060236 0.000434 0.04 4 HU 9 EU15 1.065459 1.064566 0.000893 0.08 5 AT 8 PT 1.074005 1.073794 0.000211 0.02 3 PL 7 BE 1.077408 1.077260 0.000148 0.01 4 HU 7 BE 1.085154 1.081985 0.003169 0.29 6 DE 8 PT 1.101253 1.083027 0.018226 1.66 3 PL 6 DE 1.438941 1.436939 0.002003 0.14 3 PL 5 AT 1.439526 1.433864 0.005662 0.39 4 HU 5 AT 1.450425 1.442634 0.007790 0.54 4 HU 6 DE 1.451848 1.445993 0.005855 0.40 Počet dimenzí 2 Suma čtverců vzdáleností 24.567509 Suma čtverců reziduí 0.099994 Stress 0.004070 Pseudo R 2 98.141571 Kvalita proložení je dána skutečnou vzdáleností vycházející z hodnot v matici proximity (vytvořená z tabulky dat před započetím vlastní analýzy) a vypočtenou vzdálenost s ohledem na vybraný počet dimenzí. Na základě znalosti vzdáleností zjistíme hodnotu kritéria stress a tím i hodnotu pro posouzení těsnosti proložení. 3.2.3 Mapa objektů Tabulka 21: Tabelární podoba mapy objektů [4] Proměnné Dimenze1 Dimenze2 Dimenze3 Dimenze4 CZ -0.0625 0.1854 0.0567-0.0536 SK 0.2882 0.0351-0.2204 0.0079 PL 0.7287-0.1375 0.0138-0.0175 HU 0.7372-0.1216 0.0858-0.0343 AT -0.7051-0.1494 0.0375 0.1078 DE -0.7078-0.1755-0.0388-0.0722 BE -0.3185 0.1151 0.0030-0.0317 PT 0.3359 0.1140 0.0193 0.1187 EU15-0.2961 0.1345 0.0432-0.0251 21
Tabulka obsahuje hodnoty souřadnic (dimenzí) pro jednotlivé objekty a je vlastně cílem analýzy metodou vícerozměrného škálování. Pro porovnávání podobnosti objektů však je z hlediska názornosti lepší graf mapy objektů. Graf 4: Grafická podoba mapy objektů [4] Již z původních dat je patrné, že Česká republika nelichotivě obsazuje přední místa v rámci hodnocení plynných emisí v EU. Tím více je překvapující, že se však příliš neodlišujeme od průměru původních 15 států unie, jemuž prakticky odpovídají emise v Belgii. Pozitivně ovlivňuje průměr EU Rakousko a Dánsko. Je zajímavé, že oba státy toho dosahují diametrálně odlišným postojem k jaderné energetice. Dánsko využívá jadernou energii na obdobné úrovni jako Česká republika. Naopak negativně ovlivňuje průměr EU Portugalsko a má k němu dále než ČR. Nejpodobnější Portugalsku je Slovensko. Nepodobné ostatním jsou si blízké Polsko s Maďarskem, kteří vedou nelichotivou statistiku emisí oxidů síry. 22
3.3 Nemetrické vícerozměrné škálování (NNMDS) 3.3.1 Optimalizace výpočtu pořadí vzdáleností a těsnost proložení Tabulka 22: Vyčíslení kritéria stress [4] Počet Percent Rank Proč Čárový graf dimenzí Maintained Stress ukončeno pro stress 1 71.43 0.000008 Min Stress 2 62.86 0.000009 Min Stress 3 85.71 0.000122 Max Iterations 4 85.71 0.000008 Min Stress 5 82.86 0.000005 Min Stress Oproti klasické metodě MDS založené na vzdálenosti mezi objekty, vychází neparametrická MDS z uspořádaných pořadových čísel seřazených vzdáleností mezi objekty. Z ohledem na výsledek čárového diagramu vlastních čísel z analýzy CMDS byly opět použity 2 dimenze. Opět bylo dosaženo velmi nízké hodnoty kritéria stress. Tabulka 23: Porovnání pořadí seřazených skutečných vzdáleností s vypočtenými [4] Skutečná Vypočtená Řádek Sloupec vzdálenost vzdálenost 7 BE 9 EU15 0.050413 0.000007 3 PL 4 HU 0.076123 0.000006 5 AT 6 DE 0.197280 0.000006 1 CZ 9 EU15 0.241074 0.000069 1 CZ 7 BE 0.271740 0.000069 2 SK 8 PT 0.279646 0.000057 1 CZ 8 PT 0.441495 0.339351 1 CZ 2 SK 0.475576 0.339333 3 PL 8 PT 0.485946 0.339402 6 DE 7 BE 0.489170 0.339394 5 AT 7 BE 0.489913 0.339391 4 HU 8 PT 0.494422 0.339402 5 AT 9 EU15 0.515347 0.339391 6 DE 9 EU15 0.523924 0.339394 2 SK 3 PL 0.528444 0.339383 2 SK 4 HU 0.567155 0.339383 8 PT 9 EU15 0.648863 0.339402 2 SK 9 EU15 0.649490 0.339384 2 SK 7 BE 0.652709 0.339388 7 BE 8 PT 0.671673 0.339407 1 CZ 5 AT 0.742535 0.339460 1 CZ 6 DE 0.745630 0.339463 1 CZ 3 PL 0.856408 0.641281 1 CZ 4 HU 0.857377 0.641282 2 SK 6 DE 1.037159 0.641279 2 SK 5 AT 1.047523 0.641278 3 PL 9 EU15 1.060671 0.641314 4 HU 9 EU15 1.065459 0.641315 5 AT 8 PT 1.074005 0.641313 3 PL 7 BE 1.077408 0.641320 4 HU 7 BE 1.085154 0.641321 6 DE 8 PT 1.101253 0.641314 3 PL 6 DE 1.438941 0.872393 3 PL 5 AT 1.439526 0.872394 4 HU 5 AT 1.450425 0.872397 4 HU 6 DE 1.451848 0.872396 23
Dissimilarities U metody NNMDS nelze porovnávat rezidua v jednotkách vzdálenosti, protože metoda vychází z pořadových čísel a vypočtené vzdálenosti mohou být dost odlišné od zadaných. Cílem NNMDS je optimalizovat vypočítané pořadí vzdáleností, tak aby se co nejvíce blížilo zadanému. Graf 5: Skutečná vs. vypočítaná vzdálenost [4] 1.50 Dissimilarity Fit Plot 1.13 0.75 0.38 0.00 0.00 0.25 0.50 0.75 1.00 Distance V grafu jsou patrné 4 shluky bodů reprezentující podobné hodnoty vypočítaných vzdáleností, což v následujícím grafu mapy objektů se projevilo v existenci 4 shluků podobných si objektů. 3.3.2 Mapa objektů Tabulka 24: Tabelární podoba mapy objektů [4] Proměnné Dimenze1 Dimenze2 CZ -0.1504 0.0940 SK 0.1889 0.0926 PL 0.4546-0.1186 HU 0.4546-0.1186 AT -0.4178-0.1151 DE -0.4178-0.1151 BE -0.1505 0.0940 PT 0.1889 0.0927 EU15-0.1505 0.0940 24
Dim2 Graf 6: Grafická podoba mapy objektů [4] NNMDS Map 0.10 BE EU15 CZ SK PT 0.04-0.03-0.09 AT DE PL HU -0.15-0.60-0.30 0.00 0.30 0.60 Dim1 Mapa objektů pro metodu NNMDS potvrzuje závěry o podobnosti objektů vyřčené na základě výsledků CMDS. Podobnost států z hlediska emisních ukazatelů znečištění ovzduší: Rakousko a Dánsko, Průměr evropské 15 a Belgie s Českou republikou, Slovensko s Portugalskem, Polsko s Maďarskem. Přehlednost mapy se však zhoršuje, protože podobné objekty se překrývají. 25
3.4 Korespondenční analýza (CA) 3.4.1 Data Tabulka 25: Data [3] sox nox nh3 co2 tzl CZ 22.20 32.30 8.10 11.80 8.80 SK 19.00 19.00 5.60 7.20 10.80 PL 37.70 20.60 8.50 7.60 11.70 HU 35.30 17.70 6.60 5.50 7.40 AT 4.40 24.50 6.70 8.30 8.90 DE 7.40 17.20 7.30 10.30 9.80 BE 14.80 28.20 7.40 11.10 9.60 PT 28.40 27.80 8.90 6.10 9.40 EU15 14.20 24.30 8.50 11.00 9.40 Tabulka dat pro korespondenční analýzu obsahuje totožná data s tabulkou dat pro vícerozměrné škálování, ale je transponovaná, protože CA vyžaduje mít objekty v řádcích a sledované znaky (proměnné) ve sloupcích. 3.4.2 Profily Tabulka 26: Řádkové profily v % [4] sox nox nh3 co2 tzl Total CZ 26.68 38.82 9.74 14.18 10.58 100.00 SK 30.84 30.84 9.09 11.69 17.53 100.00 PL 43.79 23.93 9.87 8.83 13.59 100.00 HU 48.69 24.41 9.10 7.59 10.21 100.00 AT 8.33 46.40 12.69 15.72 16.86 100.00 DE 14.23 33.08 14.04 19.81 18.85 100.00 BE 20.82 39.66 10.41 15.61 13.50 100.00 PT 35.24 34.49 11.04 7.57 11.66 100.00 EU15 21.07 36.05 12.61 16.32 13.95 100.00 Total 29.24 33.73 10.78 12.58 13.68 100.00 Tabulka 27: Sloupcové profily v % [4] sox nox nh3 co2 tzl Total CZ 12.10 15.26 11.98 14.96 10.26 13.26 SK 10.36 8.98 8.28 9.13 12.59 9.82 PL 20.56 9.74 12.57 9.63 13.64 13.73 HU 19.25 8.36 9.76 6.97 8.62 11.56 AT 2.40 11.58 9.91 10.52 10.37 8.42 DE 4.03 8.13 10.80 13.05 11.42 8.29 BE 8.07 13.33 10.95 14.07 11.19 11.33 PT 15.49 13.14 13.17 7.73 10.96 12.85 EU15 7.74 11.48 12.57 13.94 10.96 10.74 Total 100.00 100.00 100.00 100.00 100.00 100.00 26
3.4.3 Hledání počtu projekčních dimenzí Tabulka 28: Čárový diagram vlastních čísel [4] Počet Individuální Kumulativní dimenzí vlastní číslo % %, Inercie Bar Chart 1 0.074672 87.51 87.51 IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 2 0.007075 8.29 95.80 IIIIII 3 0.002527 2.96 98.77 II 4 0.001053 1.23 100.00 I Suma 0.085329 Počet dimenzí podle čárového diagramu jsou 2. Kumulativní procento je 95,8. Pokud by byla inercie nižší než 50 pro první 2 dimenze, pak by CA nebyla vhodnou metodou pro daná data. 3.4.4 Příspěvek do inercie a hlavní komponenty Tabulka 29: Zobrazení řádkového profilu a příspěvku inercie [4] -------- Osa1 -------- -------- Osa2 -------- Kategorie Kvalita Mass Inercie Souřadnice COR CTR Souřadnice COR CTR 1 CZ 0.771 0.133 0.031-0.071 0.252 0.009-0.102 0.519 0.194 2 SK 0.491 0.098 0.020 0.042 0.102 0.002 0.082 0.388 0.094 3 PL 0.999 0.137 0.182 0.328 0.953 0.198 0.072 0.046 0.101 4 HU 0.994 0.116 0.252 0.430 0.994 0.287-0.007 0.000 0.001 5 AT 0.968 0.084 0.213-0.454 0.955 0.232-0.054 0.013 0.034 6 DE 0.987 0.083 0.144-0.336 0.764 0.126 0.182 0.223 0.387 7 BE 0.961 0.113 0.056-0.196 0.913 0.058-0.045 0.047 0.032 8 PT 0.844 0.128 0.053 0.148 0.614 0.037-0.090 0.230 0.148 9 EU15 0.920 0.107 0.049-0.187 0.906 0.051 0.023 0.013 0.008 Tabulka 30: První hlavní komponenta na ose 1 [4] Kategorie Mass Inercie Vzdálenost Souřadnice COR CTR Úhel Vlastní číslo 1 CZ 0.133 0.031 0.020-0.071 0.252 0.009 59.9 0.000669 2 SK 0.098 0.020 0.017 0.042 0.102 0.002 71.4 0.000175 3 PL 0.137 0.182 0.113 0.328 0.953 0.198 12.5 0.014768 4 HU 0.116 0.252 0.186 0.430 0.994 0.287 4.5 0.021410 5 AT 0.084 0.213 0.216-0.454 0.955 0.232 12.2 0.017338 6 DE 0.083 0.144 0.148-0.336 0.764 0.126 29.1 0.009380 7 BE 0.113 0.056 0.042-0.196 0.913 0.058 17.1 0.004364 8 PT 0.128 0.053 0.035 0.148 0.614 0.037 38.4 0.002797 9 EU15 0.107 0.049 0.039-0.187 0.906 0.051 17.8 0.003772 Tabulka 31: Druhá hlavní komponenta na ose 2 [4] Kategorie Mass Inercie Vzdálenost Souřadnice COR CTR Úhel Vlastní číslo 1 CZ 0.133 0.031 0.020-0.102 0.519 0.194 43.9 0.001375 2 SK 0.098 0.020 0.017 0.082 0.388 0.094 51.4 0.000667 3 PL 0.137 0.182 0.113 0.072 0.046 0.101 77.6 0.000713 4 HU 0.116 0.252 0.186-0.007 0.000 0.001 89.1 0.000006 5 AT 0.084 0.213 0.216-0.054 0.013 0.034 83.4 0.000243 6 DE 0.083 0.144 0.148 0.182 0.223 0.387 61.8 0.002740 7 BE 0.113 0.056 0.042-0.045 0.047 0.032 77.4 0.000226 8 PT 0.128 0.053 0.035-0.090 0.230 0.148 61.3 0.001049 9 EU15 0.107 0.049 0.039 0.023 0.013 0.008 83.3 0.000056 27
Factor2 (8%) Kvalita je suma hodnot COR obou os a je to díl variability v daném profilu reprodukovaném oběma osami. Hodnota kvality pro SK je menší než u ostatních. Je to jen 0,491 (tedy 49,1 %), což může vést ke zkreslení bodu v grafu. Mass je poměr řádkové a celkové četnosti tabulky. CTR je příspěvek daného profilu do inercie celé osy. COR je koeficient korelace mezi daným profilem a osou. Úhel značí úhel mezi osou a profilem. 3.4.5 Diagnostické grafy CA Graf 7: Řádkové profily [4] Correspondence Plot 0.20 0.11 DE Legend Rows Columns SK PL 0.03 EU15 HU -0.06 AT BE CZ PT -0.15-0.60-0.30 0.00 0.30 0.60 Factor1 (88%) Jak z grafu řádkových profilů vyplývá metoda CA nedávat zcela shodné výsledky s metodou MDS. Shody s MDS: Belgie má blízko k Evropské 15 a k České republice. Dánsko je vzdáleno od ostatních. Polsko je blízko Maďarsku. Portugalsko je vzdáleno EU15 více než ČR. Rozdíly od MDS: Zejména postavení Slovenska daleko od Portugalska a blízko EU15 je dost odlišné. Také Rakousko je blíže EU15 a Belgii a daleko od Dánska. 28
Factor2 (8%) Graf 8: Řádkové a sloupcové profily [4] Correspondence Plot 0.20 0.11 DE tzl Legend Rows Columns co2 SK PL 0.03 nh3 EU15 sox HU -0.06 AT BE nox CZ PT -0.15-0.60-0.30 0.00 0.30 0.60 Factor1 (88%) Vynést řádkové a sloupcové profily do jednoho grafu je zdánlivě nelogické, protože obě skupiny jsou do nové roviny promítnuty z nestejně rozměrných prostorů, proto je nutné nepřikládat poměrům vzdáleností mezi objekty a znaky zásadní význam. Ovšem obecně se dá říci, že objekt blízký některému znaku s ním pravděpodobně souvisí. I v tomto grafu jsou patrné některé oprávněně malé vzdálenosti mezi objekty a znaky: ČR má nejvyšší emise oxidů dusíku z uvedených států. Maďarsko má vysoké emise oxidů síry. Rakousko má v porovnání s ostatními státy nízké emise, ale s výjimkou oxidů dusíku k nimž má v grafu nejblíže. Totéž platí o Dánsko má vyšší hodnoty skleníkových plynů a tuhých znečišťujících látek a k oběma ukazatelům má také nejblíže. Polsko je mezi body označující emise amoniaku, oxidů síry a tuhých znečišťujících látek, což odpovídám vysokých hodnotám těchto druhů emisí pro tento stát. Portugalsko je mezi body pro oxidy síry a dusíku, to rovněž souhlasí s uvedenými daty. 3.5 Závěr Klasické i nemetrické řešení metody vícerozměrného škálování dávaly výsledky v podstatě shodné, ovšem závěry z provedené korespondenční analýzy již zcela totožné nejsou. Přesto je vhodné provádět na stejných datech více analýz s cílem získání ucelenějších informací v nich skrytých. 29
Literatura a software [1] ČHMÚ databáze jakosti vody (http://hydro.chmi.cz/ojv2/) [2] STATISTICA 7.0 (http://www.statsoft.cz) [3] Statistická ročenka životního prostředí České republiky 2006. MŽP ČR, Praha 2006. [4] NCSS 2000 (http://www.ncss.com/) [5] Meloun M., Militký J., Hill M.: Počítačová analýza vícerozměrných dat v příkladech. Academia, Praha 2005. [6] Pytela O.: Chemometrie pro organické chemiky. Univerzita Pardubice, skripta, Pardubice 2003. 30
Přílohy Tabulka I: Analyzovaný výběr objekty podzemních vod [1] Objekt TO2 TO ph K T R A M O2 CHSKMn KNK4.5 ZNK8.3 NH4 NO2 NO3 PO4 Cl SO4 1 PB0016 P 0 7.7 29.4 8.6 129.5 0.005 245.0 9.0 0.25 2.20 0.20 0.025 0.003 11.5 0.020 4.6 23.5 3 PB0030 P 0 7.1 6.6 9.0 146.0 0.015 58.5 10.5 0.58 0.35 0.13 0.025 0.003 2.5 0.020 1.7 9.3 5 PB0075 P 0 7.1 28.6 10.9 195.0 0.013 240.0 10.4 1.08 1.56 0.42 0.025 0.003 2.1 0.090 6.1 53.5 7 PB0094 P 0 6.2 7.0 8.9 109.5 0.013 54.5 12.0 0.25 0.18 0.30 0.025 0.003 4.5 0.020 2.0 14.5 9 PB0113 P 0 7.8 61.0 10.0 160.5 0.013 515.0 10.5 0.58 4.50 0.45 0.025 0.003 12.5 0.030 19.5 67.0 11 PB0148 P 0 6.5 6.0 9.3 230.5 0.013 50.9 11.4 0.49 0.25 0.40 0.025 0.003 3.9 0.171 3.5 9.0 13 PB0174 P 0 7.3 37.9 10.2 172.0 0.022 203.9 9.1 0.25 2.75 0.88 0.025 0.003 5.6 0.025 6.5 49.7 15 PB0285 P 0 7.1 74.5 12.1 178.5 0.004 402.4 4.7 0.42 7.33 2.28 0.025 0.003 2.5 0.073 11.4 39.6 17 PB0337 P 0 7.0 75.4 10.4 175.0 0.038 416.8 7.0 0.44 5.95 2.43 0.025 0.003 22.4 0.052 25.0 60.8 19 PB0365 P 0 5.9 14.5 9.2 162.0 0.018 74.9 8.2 0.72 0.25 0.76 0.025 0.003 2.4 0.052 6.0 43.4 21 PB0371 P 0 7.0 80.2 11.8 183.5 0.056 374.5 9.9 1.89 1.79 0.73 0.025 0.003 186.0 0.059 53.1 94.0 23 PB0393 P 0 7.3 87.8 11.6 192.0 0.012 484.9 8.8 0.62 7.45 2.48 0.025 0.003 23.8 0.182 30.2 70.4 25 PB0415 P 0 7.4 54.9 9.8 195.0 0.021 300.9 8.7 0.25 4.46 1.40 0.025 0.003 14.0 0.025 6.5 58.3 27 PB0464 P 0 5.8 9.3 9.3 162.0 0.003 60.6 8.0 0.46 0.39 0.91 0.025 0.008 4.7 0.182 4.7 17.4 29 PB0472 P 0 5.4 11.0 8.7 183.5 0.006 60.8 9.7 0.51 0.19 0.63 0.025 0.009 2.6 0.139 3.5 37.1 31 PO0011 P 0 5.8 39.0 10.8 185.0 0.008 265.0 8.7 0.25 0.27 0.82 0.025 0.003 69.0 0.050 27.0 60.5 33 PO0017 P 0 7.2 59.3 10.1 47.0 0.008 520.0 1.7 0.48 5.44 1.10 0.290 0.003 0.5 0.020 4.2 48.0 35 PO0027 P 0 7.8 53.1 10.4 92.0 0.005 435.0 11.5 0.38 4.10 0.69 0.025 0.003 11.0 0.020 4.9 56.5 37 PO1804 P 0 7.3 14.3 10.5 66.5 0.008 108.0 12.5 0.25 0.81 0.20 0.025 0.003 1.8 0.020 2.1 23.0 39 PO3003 P 0 6.4 19.2 10.3 201.5 0.013 165.0 9.4 0.25 0.63 0.83 0.025 0.003 13.5 0.195 8.3 34.5 41 PO4008 P 0 6.4 14.2 7.7 160.5 0.005 120.0 8.3 0.25 0.75 0.70 0.025 0.003 8.8 0.030 2.6 16.0 43 PO4015 P 0 7.6 19.3 7.7 149.0 0.005 170.0 9.1 0.25 1.56 0.20 0.025 0.003 4.4 0.020 1.3 14.0 45 PP0026 P 0 6.9 9.7 7.4-13.5 0.005 74.0 11.4 0.37 0.43 0.08 0.005 0.001 1.3 0.052 4.0 15.0 47 PP0051 P 0 7.4 42.5 8.9-11.5 0.007 350.0 7.1 0.45 3.00 0.23 0.005 0.001 21.0 0.121 6.5 39.0 49 PP0056 P 0 7.3 9.8 7.2 107.0 0.009 69.5 11.0 0.37 0.18 0.12 0.005 0.003 6.3 0.293 1.1 14.0 51 PP0091 P 0 7.3 94.0 9.5 194.5 0.021 750.0 10.3 0.49 5.73 0.53 0.005 0.002 78.6 0.086 45.1 73.5 53 PP0114 P 0 7.5 28.0 8.3 13.0 0.017 235.0 9.4 0.60 2.18 0.12 0.005 0.001 0.4 0.111 3.3 29.5 55 PP0121 P 0 6.0 19.9 8.8-9.5 0.020 145.0 9.3 0.53 0.37 0.52 0.005 0.001 32.2 0.209 6.9 29.5 57 PP0157 P 0 7.6 46.6 9.0 322.0 0.003 365.0 8.8 0.37 3.20 0.17 0.005 0.001 19.1 0.274 15.6 36.5 59 PP0164 P 0 7.3 132.5 9.6 350.0 0.033 1100.0 8.4 0.77 7.08 0.83 0.005 0.001 90.1 0.234 44.6 200.0 61 PP0191 P 0 7.4 25.6 9.4 245.5 0.005 205.0 9.5 0.25 1.60 0.32 0.025 0.003 12.5 0.020 4.7 27.5 63 PP0210 P 0 7.2 19.1 10.5 210.8 0.010 135.0 11.0 0.25 0.65 0.24 0.025 0.003 3.6 0.060 4.4 44.0 65 PP0232 P 0 7.8 83.3 10.7 231.0 0.025 735.0 8.9 0.25 5.70 0.30 0.148 0.006 18.5 0.020 31.5 130.0 67 PP0261 P 0 6.3 18.6 11.8 104.5 0.070 129.9 9.5 3.47 0.51 0.28 0.025 0.003 11.4 0.025 6.6 44.0 69 PP0271 P 0 5.4 17.0 8.9 192.0 0.017 116.1 9.9 2.01 0.26 0.46 0.025 0.007 19.1 0.042 7.1 42.5 71 PP0277 P 0 6.7 40.1 11.0 163.5 0.034 292.0 9.9 1.15 1.39 0.60 0.025 0.016 53.6 0.126 29.6 42.3 73 PP0285 P 0 6.4 6.7 7.4 168.0 0.015 51.9 11.0 1.68 0.14 0.18 0.025 0.003 7.0 0.036 2.6 14.5 75 PP0292 P 0 7.6 63.9 11.2 248.5 0.064 485.0 9.5 2.24 2.48 0.20 0.035 0.198 62.1 0.088 24.6 104.5 77 PP0300 P 0 7.0 77.0 9.6 158.0 0.019 643.9 8.9 0.54 5.17 1.33 0.025 0.003 33.1 0.025 32.9 83.3 79 PP0319 P 0 5.6 12.0 8.3 245.0 0.011 92.4 8.4 0.44 0.40 0.68 0.025 0.006 18.8 0.082 5.4 19.3 81 PP0327 P 0 5.6 23.0 10.1 200.5 0.021 161.3 8.1 0.44 0.55 1.01 0.025 0.003 29.4 0.106 11.2 39.4 83 PP0346 P 0 5.7 34.8 8.6 221.0 0.031 242.6 9.0 0.88 0.42 0.71 0.025 0.003 84.3 0.041 12.3 55.9 85 PP0360 P 0 6.1 6.7 8.1 185.5 0.009 63.5 9.2 0.57 0.28 0.28 0.005 0.001 6.3 0.127 3.0 5.7 87 PP0368 P 0 7.0 70.8 9.7 215.5 0.013 520.0 8.9 0.81 2.70 0.42 0.005 0.003 4.1 0.113 44.2 160.0 89 PP0379 P 0 6.4 24.2 9.9 265.0 0.002 180.0 5.8 1.13 1.00 0.56 0.005 0.001 30.8 0.091 20.3 7.8 91 PP0402 P 0 7.4 97.4 9.6 114.5 0.017 755.0 7.7 0.61 5.55 0.48 0.005 0.003 56.6 0.053 27.5 125.0 93 PP0427 P 0 7.3 94.8 10.1 288.5 0.015 740.0 6.9 0.80 5.33 0.49 0.005 0.002 38.9 0.140 55.8 115.0 95 PP0437 P 0 7.4 52.6 9.5 10.0 0.015 455.0 6.1 0.25 4.35 0.45 0.025 0.003 13.0 0.075 13.0 46.0 97 PP0456 P 0 7.3 56.1 10.4 120.5 0.010 485.0 5.1 0.25 4.63 0.64 0.025 0.003 2.8 0.020 9.9 68.5 99 PP0466 P 0 7.3 68.1 11.4 194.5 0.015 585.0 5.3 0.55 5.10 0.61 0.025 0.003 14.0 0.020 21.5 84.5 101 PP0477 P 0 7.2 44.9 10.0 170.0 0.015 355.0 9.4 0.43 1.87 0.32 0.135 0.137 23.5 0.440 15.5 90.5 103 PP0491 P 0 6.2 37.1 8.7 157.5 0.019 245.0 10.0 0.93 0.62 0.51 0.005 0.002 41.4 0.029 18.7 72.5 105 PP0498 P 0 5.7 67.3 10.4 293.0 0.015 485.0 9.5 0.55 0.18 0.94 0.025 0.003 14.0 0.020 37.5 275.0 107 PP0525 P 0 7.3 38.0 9.5 141.0 0.018 335.0 7.0 0.25 2.19 0.52 0.025 0.003 21.5 0.590 7.5 59.0 109 PP0533 P 0 5.8 14.7 9.8 175.5 0.005 95.5 9.3 0.25 0.16 0.59 0.025 0.003 9.5 0.020 4.0 41.0 111 PP0539 P 0 7.0 51.0 9.3 190.0 0.008 405.0 7.2 0.25 3.02 0.60 0.025 0.003 34.0 0.055 18.5 59.5 113 PP0542 P 0 5.5 10.8 8.6 143.0 0.005 66.5 9.1 0.25 0.07 0.38 0.025 0.003 6.6 0.020 2.9 31.5 115 PP0565 P 0 6.0 12.0 8.3 279.5 0.009 93.5 9.9 0.61 0.18 0.23 0.005 0.001 6.9 0.173 2.7 32.0 117 PP0574 P 0 5.6 10.9 7.6 267.0 0.008 77.0 10.4 0.57 0.10 0.27 0.005 0.001 4.0 0.070 1.2 34.0 119 PP0744 P 0 6.9 25.6 8.3 283.5 0.010 200.0 8.9 0.25 1.24 0.55 0.025 0.003 19.0 0.395 7.6 31.0 121 PP0754 P 0 5.9 7.4 7.7 198.5 0.016 62.1 10.4 0.40 0.17 0.41 0.025 0.003 2.4 0.025 3.3 16.9 123 PP0782 P 0 6.5 11.6 9.8 895.5 0.079 89.0 9.6 2.79 0.32 0.17 0.009 0.004 4.3 0.109 1.8 25.5 125 PP0789 P 0 7.0 28.1 8.7 258.5 0.021 210.0 10.2 0.93 0.76 0.15 0.005 0.002 32.1 0.135 9.5 53.5 127 PP0845 P 0 7.8 94.1 11.2 178.0 0.020 798.8 10.2 0.48 5.33 1.33 0.025 0.003 59.4 0.120 22.7 180.0 129 PP0848 P 0 6.5 7.4 8.2 193.5 0.013 49.6 9.7 0.42 0.22 0.24 0.025 0.004 4.0 0.198 3.3 12.0 131 PP0850 P 0 6.0 10.4 9.8 189.0 0.009 76.6 9.6 0.25 0.36 0.61 0.025 0.003 8.7 0.131 5.9 18.7 133 PP0853 P 0 5.7 15.6 11.0 186.0 0.015 117.5 5.0 0.44 0.69 1.49 0.025 0.005 10.7 0.158 6.2 23.7 135 PP0873 P 0 5.7 20.3 9.1 271.0 0.010 150.0 2.0 1.25 0.50 1.21 0.041 0.001 0.4 0.050 3.7 61.5 137 PP0880 P 0 5.8 6.4 9.1 278.0 0.009 59.0 9.0 0.65 0.23 0.45 0.005 0.001 4.2 0.039 4.0 7.6 139 VB0014 V 1 6.4 43.8 10.3 132.5 0.030 310.0 3.8 0.38 1.20 1.06 0.025 0.003 48.0 0.020 21.5 78.5 141 VB0044 V 1 7.2 88.2 10.2 45.5 0.008 685.0 4.5 0.98 4.89 0.83 0.025 0.004 18.5 0.035 80.5 86.0 143 VB0071 V 1 6.5 82.1 11.0-90.0 0.225 655.0 0.2 8.25 3.71 3.05 2.650 0.003 0.5 0.950 50.0 165.0 145 VB0090 V 1 6.4 22.9 12.9-104.5 0.020 175.0 1.6 2.25 0.83 1.23 0.345 0.006 0.5 0.030 11.6 44.0 147 VB0103 V 1 6.5 67.8 10.2 9.5 0.040 460.0 1.1 3.20 2.01 2.50 0.320 0.006 0.5 0.020 68.0 135.0 149 VB0147 V 1 6.0 95.4 12.9-47.0 0.089 245.9 3.0 6.86 3.94 3.58 0.460 0.054 2.9 0.025 95.1 192.0 151 VB0173 V 1 6.9 68.7 11.6-143.5 0.143 323.4 0.3 3.00 4.61 1.38 2.680 0.125 0.5 0.076 52.7 47.7 31