Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1 1 ČHMÚ, OPZV, Na Šabatce 17, 143 06 Praha 4 - Komořany sosna@chmi.cz, tel. 377 256 617 Abstrakt: Referát stručně seznamuje s nejdůležitějšími vlastnostmi časových řad výšky hladiny vody v mělkých vrtech pozorovací sítě Českého hydrometeorologického ústavu. Důraz je kladen na grafické znázornění vlastností dat. Klíčová slova: statistická analýza, časové řady, podzemní vody 1. Základní vlastnosti časových řad Výšky hladiny vody v mělkých vrtech pozorovací sítě Českého hydrometeorologického ústavu jsou měřeny v metrech nadmořské výšky nejčastěji s periodou jeden týden, postupně se zaváděním automatického měření se přechází na denní měření. Časový režim výšek hladin vody ve vrtech je užitečné rozložit na tři složky. První představuje dlouhodobé kolísání hladin, nejlépe se charakterizuje pomocí časové řady ročních průměrů nebo mediánů. Druhou představuje roční chod hladin a třetí složku tvoří velmi krátkodobé děje (vliv vydatných srážek, čerpání v blízkosti objektu, vliv blízkého toku a podobně). Na Obr.1 je příklad režimu vrtu, u kterého je prakticky zcela potlačena složka ročního chodu. Graf jeho autokorelační funkce je na Obr.3. Opačný extrém je patný na Obr.2. U tohoto objektu je složka ročního chodu velmi silně zastoupena. Potvrzuje to i graf jeho autokorelační funkce na Obr. 4. Objekt je měřen s týdenním krokem, to představuje 52 až 53 měření ročně a tomu odpovídá i lokální maximum autokorelační funkce. Většina pozorovaných objektů vykazuje režimy, které leží mezi dvěma výše popsanými extrémy. Výška [ m n.m.] 238.0 237.0 236.0 235.0 234.0 233.0 Objekt: VP0435 1.1.1971 1.1.1973 1.1.1975 1.1.1977 1.1.1979 1.1.1981 1.1.1983 1.1.1985 1.1.1987 1.1.1989 1.1.1991 1.1.1993 1.1.1995 1.1.1997 1.1.1999 Obrázek 1 Graf výšky hladiny vody ve vrtu, ukázka objektu se zcela potlačeným ročním chodem. Výška [ m n.m.] 242.0 Objekt: VP0635 241.5 241.0 240.5 240.0 1.1.1971 1.1.1973 1.1.1975 1.1.1977 1.1.1979 1.1.1981 1.1.1983 1.1.1985 1.1.1987 1.1.1989 1.1.1991 1.1.1993 1.1.1995 1.1.1997 1.1.1999 Obrázek 2 Graf výšky hladiny vody ve vrtu, ukázka objektu s výrazným ročním chodem.
Obrázek 3 Výstup z programu CTPA, graf autokorelační funkce dat z obrázku 1, objekt se zcela potlačeným ročním chodem Obrázek 4 Výstup z programu CTPA, graf autokorelační funkce dat z obrázku 2, objekt s výrazným ročním chodem
2. Roční chod Roční chod je možné názorně zobrazit například pomocí rozptylového diagramu měsíčních průměrů výšek hladin vody ve vrtu. Na Obr. 5 je ukázka takového diagramu pro vrt, jehož časový režim je zobrazen na Obr. 2 a to pro stejné časové období 1971-2000. U naprosté většiny měřených objektů se během roku podstatně mění nejen střední hodnota, ale i rozptyl a šikmost dat. Například pro vrt VP0635 je podle Tab. 1 v březnu průměrná hodnota výšky 241,4m n.m., směrodatná odchylka 0,21m a šikmost -0,51. V září je průměr 240,8m n.m., směrodatná odchylka 0,24m a šikmost -0,74. Rozdíl průměrů března a září je tedy téměř třikrát větší, než je březnová směrodatná odchylka a březnový průměr je dokonce větší, než je největší zářijová, říjnová nebo listopadová hodnota. Tuto skutečnost je třeba respektovat při výpočtu takových charakteristik jako jsou kvantily, pravděpodobnosti překročení nebo křivky překročení. Vždy je třeba je vztahovat k určitému ročnímu období. Znalost charakteristik ročního chodu pro daný měřený objekt je důležitá pro krátkodobé předpovědi výšky hladin v daném roce. Pomocí znalosti jarního maxima je možné odhadnout vývoj v následujících několika měsících za předpokladu, že ve vegetační části roku nedojde k vydatným srážkám, povodni apod. Jednotlivé mělké vrty se od sebe liší podle toho, ve kterém měsíci u nich obvykle dosahuje hladina vody maxima nebo minima. Na Obr. 6 je mapa kalendářních měsíců s nejmenším dlouhodobým průměrem výšek hladin vody ve vrtu a na Obr. 7 pak s největším průměrem. Výška [m n.m.] Objekt: VP0635 242 241.8 241.6 241.4 241.2 241 240.8 240.6 240.4 240.2 240 1 2 3 4 5 6 7 8 9 10 11 12 Měsíce Obrázek 5 Znázornění ročního chodu,rozptylový diagram měsíčních průměrů výšek hladin vody ve vrtuvp0635 pro období 1971-2000. Měsíc Průměr Medián Směrodatná Koeficient odchylka šikmosti [--] [m n.m.] [m n.m.] [m] [---] 1 241.28 241.32 0.30-1.16 2 241.37 241.37 0.24-0.75 3 241.42 241.46 0.21-0.51 4 241.34 241.38 0.21-0.52 5 241.19 241.21 0.19-0.40 6 241.05 241.04 0.21 0.14 7 240.98 240.97 0.25-0.30 8 240.90 240.86 0.25-0.19 9 240.83 240.85 0.24-0.74 10 240.84 240.84 0.27-0.35 11 240.94 240.90 0.34 0.19 12 241.11 241.17 0.36-0.38 Tabulka 1 Měsíční průměry, mediány, směrodatné odchylky a koeficienty šikmosti výšek hladin vody ve vrtu VP0365 pro období 1971-2000
Obrázek 6 Mapa kalendářních měsíců s nejmenším dlouhodobým průměrem výšek hladin vody ve vrtu pro období 1971-2000 Obrázek 7 Mapa kalendářních měsíců s největším dlouhodobým průměrem výšek hladin vody ve vrtu pro období 1971-2000
3. Střednědobé trendy v datech Pro celkem 345 mělkých vrtů víceméně rovnoměrně rozložených na území Čech (odpovídá přibližně povodí Labe i s přítoky) byly vypočítány průměrné roční výšky hladin vody. Dále byla data průměrů roků pro každý objekt zvlášť normalizována odečtením celkového průměru řady a vydělena směrodatnou odchylkou. Byla tak pro každý vrt získána poměrná veličina vyjadřující odchylku od průměru vyjádřenou v násobku směrodatné odchylky. Pro takto normalizovaná data byl pro každý rok vypočítán průměr pro celou oblast Čech a zanesen do časového grafu na Obr.8. Na jeho základě si lze udělat alespoň přibližnou představu o typickém časovém průběhu ročních průměrů hladin vrtů v oblasti Čech. Pomocí podrobnější analýzy lze vysledovat především tyto skutečnosti: Data jsou závislá. Mezi po sobě následujícími roky existuje silná autokorelace, jak je patrné z autokorelační funkce na Obr. 10 i z výsledku testu na Obr. 11. V důsledku toho jsou v grafech patrné vlny (pseudoperiody). Během třicetiletí 1971-2000 lze vysledovat celkem tři výraznější pseudoperiody. Nadprůměrné výšky hladin byly naměřeny v létech 1975-1982, 1986-1988 a 1996-1997. S postupující dobou se podprůměrná období prodlužují na úkor nadprůměrných. Celkový trend je tedy spíše klesající (pro velkou závislost v datech a krátké období měření to ale lze těžko dokázat pomocí běžných statistických testů, určitým pokusem o to je výsledek testu na Obr. 12, kde pořadový koeficient korelace vychází záporný a lze tedy předpokládat klesající trend v datech). Stejným způsobem byl sestrojen i graf pro oblast povodí Moravy na Obr. 9 a také pro 16 dalších menších oblastí. Relativní odchylka od průměru 2 1.5 1 0.5 0-0.5-1 Oblast: Čechy -1.5 1970 1975 1980 1985 1990 1995 2000 Rok y Obrázek 8 Graf relativních odchylek ročních průměrů výšek hladin vody ve vrtech.průměr pro oblast Čechy. Relativní odchylka od průměru 2 1.5 1 0.5 0-0.5-1 -1.5 Oblast: Morava -2 1970 1975 1980 1985 1990 1995 2000 Roky Obrázek 9 Graf relativních odchylek ročních průměrů výšek hladin vody ve vrtech.průměr pro oblast Morava
Obrázek 10 Výstup z programu CTPA, Graf autokorelační funkce dat z obrázku 8 (oblast Čechy) Testy náhodnosti, počet iterací Soubor : CECHY.txt Stanice : - Počet dat: n = 30 Proměnná: - Období : 1971-2000 K odhalení změny spíše periodického charakteru Kritické hodnoty: 10-21 na hladině významnosti 0.050 pro n1 <= 20 a n2 <= 20 Výsledky: počet iterací = 8 n1 = 15 n2 = 15 Hypotéza H0 : uspořádání řady je náhodné Alternativa H1 : uspořádání řady není náhodné Interpretace výsledků: Hypotézu H0 vzhledem k H1 zamítáme Obrázek 11 Výstup z programu CTPA, iterační test náhodnosti dat z obrázku 8 (oblast Čechy) Testy náhodnosti, Kendallův koeficient pořadové korelace Soubor : CECHY.txt Stanice: - Počet dat: n = 30 Proměnná: - Období : 1971-2000 Zaměřen na posuzení existence systematického posunu Kritická hodnota = 1.960 na hladině významnosti 0.050 Výsledky: Kendallův koeficient = -0.283 hodnota testové statistiky = 2.194 Hypotéza H0: uspořádání řady je náhodné Alternativa H1: uspořádání řady není náhodné Interpretace výsledků: Hypotézu H0 zamítáme Obrázek 12 Výstup z programu CTPA, test náhodnosti-kendalův koeficient pořadové korelace data z obrázku 8 (oblast Čechy) Seznam použitého programového vybavení: Procházka, M., Deyl, M. (2000): Program CTPA ArcView GIS 3.2, ESRI 2000 Kupka. K. (2004): QC.Expert V2.7, TriloByte Pardubice