Statistické zpracování naměřených experimentálních dat za rok 2012

Podobné dokumenty
Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Společenství prvního stupně ověření norem

Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )

10. Předpovídání - aplikace regresní úlohy

Metoda Monte Carlo a její aplikace v problematice oceňování technologií. Manuál k programu

You created this PDF from an application that is not licensed to print to novapdf printer (

Regresní a korelační analýza

Regresní a korelační analýza

K MOŽNOSTI IDENTIFIKACE PŮVODU ZNEČIŠTĚNÍ OVZDUŠÍ POMOCÍ KOMBINACE IMISNÍCH A METEOROLOGICKÝCH MĚŘENÍ. Josef Keder

Regresní a korelační analýza

Časový rozvrh. Agenda. 1 PŘÍPRAVA K CERTIFIKACI IPMA

DETEKCE FUGITIVNÍCH EMISÍ Z POVRCHOVÝCH UHELNÝCH LOMŮ. Josef Keder Lubomír Paroha

ZÁKLADNÍ NÁSTROJE ŘÍZENÍ JAKOSTI

Tabulka 1 Rizikové online zážitky v závislosti na místě přístupu k internetu N M SD Min Max. Přístup ve vlastním pokoji ,61 1,61 0,00 5,00

Sedm základních nástrojů řízení jakosti

Tabulka 1. Výběr z datové tabulky

pracovní list studenta Kombinatorika, pravděpodobnost, základy statistiky Jak jsou vysocí? Mirek Kubera

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

vzorek vzorek

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Statistika pro geografy

Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného)

Regresní a korelační analýza

Ilustrační příklad odhadu LRM v SW Gretl

Porovnání dvou výběrů

Ukázka knihy z internetového knihkupectví

Měření zrychlení volného pádu

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Popisná statistika kvantitativní veličiny

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah SLEDOVÁNÍ PRÁCE... 4

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Úvod do problematiky měření

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

TVORBA GRAFŮ A DIAGRAMŮ V ORIGIN. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Pojem a úkoly statistiky

Analýza rozptylu dvojného třídění

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

Regresní a korelační analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Protokol č. 1. Tloušťková struktura. Zadání:

Název DUM: VY_32_INOVACE_2B_16_ Tvorba_grafů_v_MS_Excel_2007

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Korelační a regresní analýza

Inovace bakalářského studijního oboru Aplikovaná chemie

Návrh postupu pro stanovení četnosti překročení 24hodinového imisního limitu pro suspendované částice PM 10

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Finální zpráva MĚŘENÍ PARAMETRŮ KOMPRESOROVÉ JEDNOTKY NAPÁJENÉ Z REGULÁTORU FA ERAM SPOL S R.O. doc. Ing. Stanislav Mišák, Ph.D. Strana 1 (celkem 15)

Lineární regrese. Komentované řešení pomocí MS Excel

EVIDENČNÍ FORMULÁŘ. FTVS-UK evidence VaV výsledků nepodléhající řízení o zápisu u ÚPV v Praze

Korelace. Komentované řešení pomocí MS Excel

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

Analýza dat s využitím MS Excel

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Využití software ITEMAN k položkové analýze a analýze výsledků testů

LabMeredian Plus základní kurz

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Statistika. Semestrální projekt

MS Excel grafická prezentace dat

Výsledný graf ukazuje následující obrázek.

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

SYSTÉM ZPRACOVÁNÍ DAT FOTOVOLTAICKÉHO SYSTÉMU A METEOSTANICE

100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% nemáte obavy. má obavy I.04 II.02 II.05 III.03

Aplikovaná statistika v R

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

SEZNAM VZDĚLÁVACÍCH MATERIÁLŮ - ANOTACE

SEMESTRÁLNÍ PRÁCE. Určení vnitřní struktury analýzou vícerozměrných dat. Ing. Pavel Bouchalík

1. Zadání. 2. Teorie úlohy ID: Jméno: Jan Švec. Předmět: Elektromagnetické vlny, antény a vedení. Číslo úlohy: 7. Měřeno dne: 30.3.

EXPERIMENTÁLNÍ MĚŘENÍ TEPLOT ELEKTRICKÝCH TOPIDEL

Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

PŘÍKLAD 4.5 Chromatografická analýza farmakologických sloučenin Byly měřeny hodnoty R F pro 20 sloučenin s 18 eluenty. Žádné eluční činidlo však nepro

Využití tabulkového procesoru MS Excel

Kartogramy. Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita

Česká zemědělská univerzita v Praze. Provozně ekonomická fakulta. Statistické softwarové systémy projekt

O porovnání. Autoři. Vznik a interpretace porovnání

Zápočtová práce STATISTIKA I

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Základní pojmy teorie grafů [Graph theory]

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

O porovnání. Autoři. Vznik a interpretace porovnání

Popisná statistika. Komentované řešení pomocí MS Excel

Matematické modelování dopravního proudu

Spokojenost se životem

Dolování asociačních pravidel

Český hydrometeorologický ústav Úsek kvality ovzduší. Kvalita ovzduší a rozptylové podmínky na území ČR

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

STATISTICA Téma 1. Práce s datovým souborem

Elektronické zpracování dotazníků AGEL. Verze

Rozšíření bakalářské práce

Transkript:

Statistické zpracování naměřených experimentálních dat za rok 2012 Popis dat: Experimentální data byla získána ze tří měřících sloupů označených pro jednoduchost názvy ZELENA, BILA a RUDA. Tyto měřící sloupy byly umístěny v předpolí lomu ve směru postupující těžby. Data byla získávána kontinuálně a následně byla ukládána do textového souboru zvlášť pro každé měřící místo. Tato data byla zpracována za rok 2012 ze souborů uložených na k tomu účelu zřízeném datovém úložišti. Konkrétně se jednalo o následující soubory: /data/ecodust/ecoprogress/data DNT/rozbalene/ 2012all_zelena.txt 2012all_bila.txt 2012all_ruda.txt. V Excelu by roztřídění jednotlivých hodnot zabralo spoustu času. Vzhledem k rozsáhlým datovým souborům podkladových dat se jednalo o zdlouhavý postup vyžadující poměrně značné množství ruční práce. Experimentální data roztříděna pro zpracování dat jsme použili program MATLAB, ve kterém byla data zpracována a připravany následující obrázky, viz níže. Za stejných podmínek byly získávána data ze všech tří nezávislých měřících míst. Z daných souborů 2012all_bila.txt, 2012all_ruda.txt a 2012all_zelena.txt jsme zkoumali jednotlivé proměnné z hlediska jejich závislosti. První proměnná, která byla určena ke statistickému zpracování, byla rychlost (v). Další proměnnou, kterou jsme statisticky vyhodnocovali, byl směr (d). Poslední proměnnou, která z hlediska statistiky byla významná, byla teplota (t). Úkolem této statistické analýzy bylo nalézt a znázornit časové úseky, během nichž byla získána data současně ze všech tří nezávislých měřících míst. Tato data pak byla analyzována za účelem nalezení vzájemných korelací veličin a to jak v rámci jednoho měřícího místa, tak především mezi těmito měřícími místy. 1

Příklad poruchy v datech: Řada dat pro sondu RUDA je uložena v nesprávném tvaru, proto jsme museli vyřaditt značné množství záznamů, tj. 1280 naměřených experimentálních dat. Jednalo se například o časový úsek 30. 3. 2012 00:00 30. 3. 2012 00:255, kde byla závada v záznamu údaje o čase (minuty byly počítány v rozmezí 0-255 namísto 0-60) Ukázka vypuštěných dat: datum čas rychlost směr teplota 30.03.2012 00:99 5.6 160.0 32.8 30.03.2012 00:100 4.0 160.0 32.4 30.03.2012 00:101 4.6 160.0 29.9 30.03.2012 00:102 6.3 160.0 30.4 30.03.2012 00:103 5.9 160.0 28.5 30.03.2012 00:104 4.3 160.0 31.2 30.03.2012 00:105 4.8 160.0 33.2 30.03.2012 00:106 8.1 160.0 36.5 30.03.2012 00:107 7.1 160.0 41.6 30.03.2012 00:108 7.2 160.0 35.9 30.03.2012 00:109 6.2 160.0 36.7 30.03.2012 00:110 5.7 160.0 38.3 30.03.2012 00:111 4.9 160.0 35.5 30.03.2012 00:112 8.6 160.0 29.4 30.03.2012 00:113 8.3 160.0 43.8 30.03.2012 00:114 4.1 160.0 40.3 30.03.2012 00:115 4.8 160.0 39.5 Dále bylo zjištěno, že se naměřené teploty v některých časových úsecích výrazně liší od hodnot teplot uváděných v archivu ČHMÚ pro dané období. Další z chyb je v datech je zaznamenána v tab. 3.kde je zvýrazněna červeně. V tomto případě jsou v původním txt souboru zobrazeny 2x stejné hodnoty. 2

Analýza naměřených experimentálních dat: Časová řada získaných experimentálních dat je vykreslena na obr. 1., kde zelená čára zobrazuje časovou řadu pro ZELENOU sondu, černá čára znázorňuje časovou řadu pro BILOU sondu a poslední červená čára popisuje časovou řadu pro RUDOU sondu. Časový úsek v němž současně měří všechny tři sondy (BILA, RUDA a ZELENA) prakticky neexistuje (je velmi krátký). Z tohoto důvodu nelze pro sledované období provést hlubší statistickou analýzu měření ze všech tří měřících míst. Obr. 1. Časy měření po měsících za rok 2012 Na obr. 1 jsou šipkami znázorněny středy intervalů, kdy se neměřilo. Z obrázku 1 a tabulek 1, 2 a 3 je zřejmé, že neexistuje žádný dostatečně dlouhý časový úsek, který by měl nějakou vypovídací schopnost pro statistické zpracování. V tab. 2 a 3 jsou modře zobrazeny hodnoty, které byly použity pro další zpracování. Výsledky závislostí jednotlivých proměnných pro takto označené hodnoty jsou znázorněny na obr. 5. 3

Tab. 1. Zobrazuje délku segmentu pro měřící sondu ZELENA Začátek intervalu Konec intervalu Počet dat Délka Datum Čas Datum Čas mezery 9. 6. 2012 18:19 9. 6. 2012 18:47 29 10 9. 6. 2012 18:56 9. 6. 2012 19:09 14 7 9. 6. 2012 19:15 2. 7. 2012 20:49 33215 7 2. 7. 2012 20:55 4. 7. 2012 10:17 2243 32 4. 7. 2012 10:48 5. 7. 2012 17:49 1862 8 5. 7. 2012 17:56 2. 8. 2012 19:36 40421 8146 8. 8. 2012 11:22 18. 8. 2012 18:53 14852 9 18. 8. 2012 19:01 12. 9. 2012 17:29 35909 0 Tab. 2. Zobrazuje délku segmentu pro měřící sondu RUDA Začátek intervalu Konec intervalu Počet dat Délka Datum Čas Datum Čas mezery 29. 3. 2012 14:53 30. 3. 2012 00:30 578 1409 31. 3. 2012 00:31 31. 3. 2012 19:46 1188 8 31. 3. 2012 19:53 19. 4. 2012 10:29 26797 27 19. 4. 2012 10:55 5. 5. 2012 13:34 23200 9785 12. 5. 2012 18:39 16. 5. 2012 17:36 5698 7 16. 5. 2012 17:42 22. 5. 2012 19:39 8758 27360 9. 6. 2012 18:39 16. 6. 2012 22:57 10339 13 16. 6. 2012 23:09 18. 6. 2012 9:56 2088 6 18. 6. 2012 10:01 30. 6. 2012 7:09 17109 16 30. 6. 2012 7:24 2. 7. 2012 20:16 3653 41 2. 7. 2012 20:56 4. 7. 2012 10:59 2284 3 4. 7. 2012 11:01 5. 7. 2012 17:05 1805 50042 8. 8. 2012 11:06 8. 8. 2012 12:58 113 13 8. 8. 2012 13:11 18. 8. 2012 18:34 14724 21 18. 8. 2012 18:54 20. 8. 2012 19:47 2934 9 20. 8. 2012 19: 55 21.8. 2012 13:45 1071 0 Tab. 3. Zobrazuje délku segmentu pro měřící sondu BILA Začátek intervalu Konec intervalu Počet dat Délka mezery Datum Čas Datum Čas 29. 3. 2012 10:45 29. 3. 2012 10:48 5 (dvojmo čas) 2 29. 3. 2012 10:50 19. 3. 2012 10:15 30207 24 19. 3. 2012 10:39 5. 5. 2012 13:34 23216 22 5. 5. 2012 13:56 11. 5. 2012 20:22 9027 16 11. 5. 2012 20:38 11. 5. 2012 23:41 184 6 11. 5. 2012 23:47 12. 5. 2012 18:34 1128 16 12. 5. 2012 18:50 9. 6. 2012 18:24 40295 26 9. 6. 2012 18:50 9. 6. 2012 19:03 14 16 9. 6. 2012 19:19 16. 6. 2012 22:53 10295 26677 4. 7. 2012 11:16 5. 7. 2012 17:07 1792 18 5. 7. 2012 17:24 5. 7. 2012 17:28 5 3 5. 7. 2012 17:30 5. 7. 2012 17:52 23 64761 18. 8. 2012 18:31 18. 8. 2012 18:58 28 13 18. 8. 2012 19:11 21. 8. 2012 13:42 3992 25 21. 8. 2012 14:07 22. 8. 2012 6:06 960 30 22. 8. 2012 6:36 10. 9. 2012 16:58 27983 14 10. 9. 2012 17:12 11. 9. 2012 20:28 1637 8 11. 9. 2012 20:36 12. 9. 2012 17:58 1283 0 4

Analýza dat pro dvě sondy: Jako souvislou časovou řadu, v níž byla paralelně získávána měření pro dvě sondy (BILA a RUDA), jsme vybrali souvislý úsek obsahující 26784 záznamů, tj. cca ¼ dat. Jednalo se o časové období 31. 3. 2012 19:53 19. 4. 2012 10:15. V obrázcích 3. a 4. jsou vykresleny tzv. rozptylové grafy (scatter plots) pro jednotlivá měřící místa (RUDA, BILA). Z obrázků je zřejmé, že s vyjímkou teploty, která se dle očekávání cyklicky mění v čase, naměřená data nevykazují závislost mezi jednotlivými proměnnnými. Tj. rychlost nekoreluje ani se směrem ani s časem ani s teplotou, a podobně směr nekoreluje ani s časem ani s teplotou. Obr. 3. Rozptylový graf pro měřící sondu BILA v období 31. 3. 2012 19:53 19. 4. 2012 10:15 5

Obr. 4. Rozptylový graf pro měřící sondu RUDA v období 31. 3. 2012 19:53 19. 4. 2012 10:15 Časový úsek v období 31. 3. 2012 19:53 19. 4. 2012 10:15 již má vypovídací hodnotu, a měly by se dát zjistit jednotlivé závislosti naměřených experimentálních dat. Tuto jednu čtvrtinu dat jsme také zpracovali do rozptylového diagramu, který je zobrazen na obr. 5. Na hlavní diagonále jsou znázorněny histogramy jednotlivých proměnných pro sondy BILA a RUDA. Teploty RUDA a BILA spolu korelují dle očekávání dobře. Teplota se cyklicky střídá (má periodické chování). Rychlost a teplota spolu nekorelují. Rychlost a směr spolu taktéž nekorelují. 6

Obr. 5. Rozptylový graf pro měřící sondu RUDA a BILA v období 31. 3. 2012 19:53 19. 4. 2012 10:15. Obr. 6. Rozptylový graf pro BILOU a RUDOU sondu 7

Grafy ukazují na závislost mezi: BILA rychlost, RUDA směr; RUDA rychlost, BILA směr; Pro takovou závislost neexistuje racionální (fyzikální) důvod. Podrobnější náhled závislosti RUDA rychlost a BILA směr viz obr. 6. Také typ rozdělení veličin rychlost a směr je pro RUDA přesně opačně než pro BILA. Jedním z možných vysvětlení je záměna v zapojení čidel pro rychlost a směr větru na měřícím místě BILA. Tuto hypotézu podporuje i následující analýza krátkého úseku dat ze všech tří měřících míst. Analýza dat pro tři sondy: Jako ukázka situace, kdy máme data pro všechny tři sondy současně, je období 9. 6. 2012 19:19 16.6.2012 22:53, tj. 10295 hodnot (tj. cca 10 %). Výsledky a korelace pro tento týden potvrzují to, co jsme již viděli pro analýzu 2 sond (RUDA, BILA) na předchozích stránkách, tj. dle očekávání závislosti jednotlivých teplot u všech tří sond spolu silně korelují; rychlost a teplota spolu nekorelují; rychlost a směr spolu taktéž nekorelují. Obr.7. Časy měření pro všechny tři sondy v období od 9. 6. 2012 19:19 16.6.2012 22:53 V obrázcích 8., 9. a 10. jsou vykresleny tzv. rozptylové grafy (scatter plots) pro jednotlivá měřící místa (RUDA, BILA, ZELENA) pro časové období od 9. 6. 2012 8

19:19 16.6.2012 22:53. Z následujících obrázků můžeme udělat podobné závěry jako pro dvě sondy (RUDA, BILA). Grafy ukazují na závislost mezi: BILA rychlost, RUDA směr; RUDA rychlost, BILA směr; což opět nedává logicky smysl jako u předcházející analýzy. Obr. 8. Rozptylový graf pro měřící sondu RUDA v období od 9. 6. 2012 19:19 16.6.2012 22:53 9

Obr. 9. Rozptylový graf pro měřící sondu BILA v období od 9. 6. 2012 19:19 16.6.2012 22:53 Obr. 10. Rozptylový graf pro měřící sondu BILA v období od 9. 6. 2012 19:19 16.6.2012 22:53 10

Obr.11. Rozptylový graf pro všechny tři sondy v období od 9. 6. 2012 19:19 16.6.2012 22:53 Jak již bylo zmíněno, závislosti z měřících míst ZELENA a RUDA jsou si svým charakterem blízké. Proto se jeví jako nejpravdepodobnější, že vadné je zapojení sond na měřícím místě BILA, kde jsou prohozeny výstupy čidel pro rychlost a směr větru. Závěr Podle očekávání lze říci že jednotlivé sledované veličiny spolu (v rámci jednoho měřícího místa) nijak významně nekorelují. Analýzou dat se podařilo odhalit pravděpodobnou závadu v měřícím systému a vyřadit tato vadná data. Takovýto postup lze i do budoucna využít pro verifikaci nezávisle prováděných měření. Pro rok 2014 je plánováno využití obdobných statistických postupů pro analýzu dat získaných v roce 2013 z měřících sloupů v předpolí lomu a rozšíření korelační analýzy i pro ostatní měřící místa. 11