Statistická analýza jednorozměrných dat

Podobné dokumenty
Kvantily a písmenové hodnoty E E E E-02

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

UNIVERZITA PARDUBICE

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Statistická analýza. jednorozměrných dat

S E M E S T R Á L N Í

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Analýza rozptylu ANOVA

Statistická analýza jednorozměrných dat

S E M E S T R Á L N Í

Porovnání dvou reaktorů

Nejlepší odhady polohy a rozptýlení chemických dat

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Statistická analýza jednorozměrných dat

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Exploratorní analýza dat

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

Modul Základní statistika

Kalibrace a limity její přesnosti

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Porovnání dvou výběrů

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Průzkumová analýza dat

UNIVERZITA PARDUBICE

Úloha 1: Lineární kalibrace

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

LICENČNÍ STUDIUM GALILEO SEMESTRÁLNÍ PRÁCE

Charakteristika datového souboru

Zápočtová práce STATISTIKA I

, Brno Hanuš Vavrčík Základy statistiky ve vědě

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Uni- and multi-dimensional parametric tests for comparison of sample results

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

IDENTIFIKACE BIMODALITY V DATECH

Tvorba nelineárních regresních modelů v analýze dat

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Kalibrace a limity její přesnosti

Statistická analýza jednorozměrných dat

přesnost (reprodukovatelnost) správnost (skutečná hodnota)? Skutečná hodnota použití různých metod

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Charakterizace rozdělení

Tvorba nelineárních regresních modelů v analýze dat

Analýza dat na PC I.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika

Kalibrace a limity její přesnosti

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

2.2 Kalibrace a limity její p esnosti

PYTHAGORAS Statistické zpracování experimentálních dat

Chyby spektrometrických metod

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti

pravděpodobnosti, popisné statistiky

Statistika pro geografy

Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Testy statistických hypotéz

Popisná statistika. Komentované řešení pomocí MS Excel

UNIVERZITA PARDUBICE

TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Číselné charakteristiky

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Postup statistického zpracování výsledků stopové analýzy při použití transformace dat

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

INTERAKTIVNÍ POČÍTAČOVÁ ANALÝZA DAT prof. RNDr. Milan Meloun, DrSc.

Příklady na testy hypotéz o parametrech normálního rozdělení

VŠB Technická univerzita Ostrava BIOSTATISTIKA

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Lineární regrese. Komentované řešení pomocí MS Excel

Plánování experimentu

UNIVERZITA PARDUBICE

TECHNICKÁ UNIVERZITA V LIBERCI

Praktická statistika. Petr Ponížil Eva Kutálková

KALIBRACE. Definice kalibrace: mezinárodní metrologický slovník (VIM 3)

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Normální (Gaussovo) rozdělení

ZNALOSTI A DOVEDNOSTI ČESKÝCH MUŽŮ V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY

Tvorba nelineárních regresních

PRŮZKUMOVÁ ANALÝZA DAT (EDA)

Transkript:

Licenční studium Galileo: Statistické zpracování dat Analýza velkých výběrů Hornův postup analýzy malých výběrů Statistické testování Statistická analýza jednorozměrných dat Semestrální práce Lenka Husáková Pardubice 2015

Obsah 1 Statistická analýza velkých výběrů... 4 1.1 Zadání... 4 1.2 Data... 4 1.3 Použitý software... 5 1.4 Exploratorní analýza dat... 5 1.4.1 Grafické diagnostiky... 5 1.4.2 Kvantily a písmenové hodnoty... 8 1.4.3 Porovnání rozdělení... 10 1.5 Ověření předpokladů o datech... 10 1.6 Mocninná transformace... 11 1.7 Konfirmatorní analýza dat... 14 1.8 Závěr... 15 1.9 Literatura... 16 2 Statistická analýza malých výběrů dle Horna... 17 2.1 Zadání... 17 2.2 Data... 17 2.3 Použitý software... 17 2.4 Řešení... 18 2.4.1 Analýza souboru s lichým počtem prvků... 18 2.4.2 Analýza souboru se sudým počtem prvků... 19 2.4.3 Analýza malých výběrů za využití programu QC-Expert... 20 2.5 Závěr... 22 2.6 Literatura... 22 3 Statistické testování... 23 3.1 Test správnosti... 23 3.1.1 Zadání... 23 3.1.2 Data... 23 3.1.3 Použitý software... 24 3.1.4 Ověření předpokladů o datech... 24 3.1.5 Vyčíslení odhadů výběrových parametrů... 25 3.1.6 Závěr... 25 3.1.7 Literatura... 25 3.2 Test shodnosti... 26 3.2.1 Zadání... 26

3.2.2 Data... 26 3.2.3 Použitý software... 26 3.2.4 Ověření předpokladů o datech... 26 3.2.5 Test shody rozptylů... 27 3.2.6 Test shody středních hodnot dvou souborů... 28 3.2.7 Závěr... 28 3.3 Párový test... 29 3.3.1 Zadání... 29 3.3.2 Data... 29 3.3.3 Použitý software... 29 3.3.4 Řešení... 29 3.3.5 Závěr... 30 3.3.6 Literatura... 30

1 Statistická analýza velkých výběrů 1.1 Zadání Stanovení rtuti ve vzorcích jater, žeber a tuku vydry říční termooxidační metodou Vydra říční je chráněný živočišný druh českou i evropskou legislativou. V rámci programu Péče o vydru říční (2009) 1 oficiálně schváleným Ministerstvem životního prostředí je vyvíjena snaha o zlepšení podmínek k životu tohoto chráněného druhu. Nedílnou součástí programu jak z hlediska sledování stavu populace, tak z hlediska hodnocení účinnosti realizovaných opatření je i detailní monitoring druhu včetně sběru a analýz uhynulých jedinců, který v České Republice provádí společnost ALKA Wildlife, o.p.s. 2,3. V rámci monitoringu, s cílem hledání možné souvislosti mezi znečištěním jednotlivých oblastí ČR a jeho vlivem na kvalitu života vyder bylo provedeno stanovení celkového obsahu rtuti ve vzorcích jater, kostí a tuku uhynulých vyder říčních termooxidační metodou 4. Cílem bylo provést analýzu statistických vlastností dat. Určit základní popisné statistiky, intervaly spolehlivosti, robustní odhady střední hodnoty a rozptylu, ověřit normalitu, nezávislost a homogenitu jednotlivých výběrů. 1.2 Data Tabulka 1.1: Koncentrace Hg (mg kg -1 ) ve vzorcích jater (n = 98), kostí (n = 93) a tuku (n = 118) vyder říčních stanovená termooxidační metodou a (a) Játra, n = 98 0.129 1.806 4.626 8.829 3.652 0.394 1.171 1.089 1.505 3.899 2.953 2.547 3.14 5.738 0.052 0.044 2.256 1.801 0.106 1.419 (b) Žebra, n = 93 0.047 0.124 0.030 0.242 0.103 0.941 0.052 1.419 0.451 0.186 0.318 0.797 0.336 0.159 0.171 0.058 0.103 0.191 0.044 0.647 (c) Tuk, n = 118 0.135 0.083 0.026 0.131 0.176 0.184 0.262 0.159 0.160 0.109 0.048 0.159 0.092 0.159 0.159 0.070 0.705 0.092 0.140 0.078 a data jsou uvedena v pořadí, ve kterém byla naměřena, aby nedošlo ke zkreslení jejich vnitřní struktury 4

1.3 Použitý software Naměřená data byla vyhodnocena pomocí statistických programů ADSTAT 1.25 a 2.0, QC-Expert 2.5 (TriloByte Statistical Software, s.r.o., ČR) a programu NCSS2007 (NCSS Statistical Software, USA). 1.4 Exploratorní analýza dat 1.4.1 Grafické diagnostiky Pro podrobné seznámení se strukturou dat, posouzení symetrie a špičatosti rozdělení, identifikaci odlehlých bodů a případných hrubých chyb bylo využito následujících šestnácti grafických diagnostik (obr. 1.1A-M). A) Histogram (obr. 1.1-A): zobrazuje data z hlediska četností zastoupení v jednotlivých třídách s konstantní šířkou, generovaných automaticky s ohledem na počet dat. Ve všech případech, tj. koncentrace Hg v játrech, žebrech i tuku graf indikuje silně sešikmená rozdělení s největší četností dat náležící oblasti nižších koncentrací. B) Kvantilově-kvantilový (Q-Q) graf (obr. 1.1-B): jelikož většina bodů neleží na přímce jde o asymetrické rozdělení, konkávně-konvexní charakter dat poukazuje ve všech případech na vyšší špičatost než odpovídá normálnímu rozdělení C) Diagram rozptýlení a rozmítnutý diagram rozptýlení (obr. 1.1-C): v případě analýzy jater poukazuje na 4 odlehlé body v horní části diagramu, podobně na přibližně 11 a 8 odlehlých bodů v horní části diagramu odpovídajícímu souboru dat analýzy žeber, resp. tuku. D) Jádrový odhad hustoty pravděpodobnosti (obr. 1.1-D): ve srovnání s Gaussovým rozdělením je patrné silné zešikmení k vyšším hodnotám. Empirickou křivku nelze aproximovat symetrickým Gaussovým rozdělením. E) Krabicový graf (obr. 1.1-E): v horní části, tj. mimo horní hradbu jsou pro případ jater detekovány 4 odlehlé body, dále pak přibližně 11 bodů pro žebra a 8 pro tuk. F) Graf autokorelačních koeficientů (obr. 1.1-F): v případě všech tří testovaných výběrů jsou na hladině významnosti 0.05 autokorelační koeficienty statisticky nevýznamné, data je tedy možné považovat za nezávislá. G) Graf trendů (obr. 1.1-G): V případě výběru jater a tuku křivky klouzavého průměru a mediánu nevykazují hladký průběh, v datech není indikován trend. Na druhou stranu v případě výběru žeber je v datech významný lineární trend, který v grafu dokumentuje příslušná regresní přímka. H) Kvantilový graf (obr. 1.1-H): V případě výběru jater, žeber a tuku lépe prokládá data červená křivka a pro tato data je vhodné zvolit jako odhad medián. Pro výběr jater však není mezi proložením funkcí s klasickým průměrem a rozptylem (nerobustní) a červenou křivkou odpovídající mediánu a mediánové odchylce (robustní) již takový rozdíl. I) Pravděpodobnostní P-P graf (obr. 1.1-I): empirická křivka nesouhlasí s žádnou křivkou symetrického rozdělení (normálního, rovnoměrného a Laplaceova). Jednotlivá rozdělení jsou asymetrická. J) Graf rozptýlení s kvantily (obr. 1.1-J): asymetrie vzdálenosti mezi dolními hranami kvantilových obdélníků (F, E a D) indikuje asymetrické rozdělení sešikmené k vyšším hodnotám, na kvantilové funkci mimo obdélník D je patrný náhlý vzrůst a body ležící vně sedecilového obdélníku jsou klasifikovány jako odlehlé. 5

A B C D E F G Obr. 1.1 Vybrané grafické diagnostiky EDA: (A) Histogram, (B) Kvantilově-kvantilový Q-Q graf, (C) Diagram rozptýlení a rozmítnutý diagram rozptýlení, (D) Jádrový odhad hustoty pravděpodobnosti, (E) Krabicový graf, (F) Graf autokorelačních koeficientů, (G) Graf trendů 6

H I J K L M N Obr. 1.1. Pokračování: Vybrané grafické diagnostiky EDA: (H) Kvantilový graf, (I) P-P graf, (J) Graf rozptýlení s kvantily, (K) Graf polosum, (L) Graf symetrie, (M) Graf špičatosti, (N) Kruhový graf 7

Percentily Percentily Percentily Percentily Percentily Percentily Diagram percentily - Uloha 1 - Játra Diagram percentily - Uloha 1 - Žebra Diagram percentily - Uloha 1 - Tuk 20,0 1,5 0,8 13,3 1,0 0,5 6,7 O 0,5 0,3 0,0 Játra Relativní hustota hodnot (%) 0,0 Zebra Relativní hustota hodnot (%) 0,0 Tuk Relativní hustota hodnot (%) Houslový diagram - Uloha 1 - Játra Houslový diagram - Uloha 1 - Žebra Houslový diagram - Uloha 1 - Tuk 20,0 1,5 0,8 13,3 1,0 0,5 6,7 P 0,5 0,3 0,0 Játra Relativní hustota hodnot (%) 0,0 Zebra Relativní hustota hodnot (%) 0,0 Tuk Relativní hustota hodnot (%) Obr. 1.1. Pokračování: (O) Diagram percentilů, (P) Houslový diagram K) Graf polosum (obr. 1.1-K): indikuje velkou část bodů jako vybočujících ze symetrického rozdělení. Body, ležící na mediánové rovnoběžce s osou x jsou ze symetrického rozdělení, ostatní nikoliv. L) Graf symetrie (obr. 1.1-L): indikuje valnou část bodů jako vybočujících ze symetrického rozdělení nebo patřících do asymetrického rozdělení. M) Graf špičatosti (obr. 1.1-M): většina bodů neleží na rovnoběžce s osou x pro symetrické rozdělení, a proto jde o rozdělení asymetrické. N) Kruhový graf (obr. 1.1-N): tvar elipsy dokazuje silně asymetrické rozdělení zešikmené k vyšším hodnotám. O) Diagram percentilů (obr. 1.1-O): z tvaru diagramu lze indikovat silnou asymetrii pro všechny studované výběry. P) Houslový diagram (obr. 1.1-P): asymetrický tvar houslí poukazuje na silně sešikmené rozdělení, pravděpodobně exponencionální či log-normální. 1.4.2 Kvantily a písmenové hodnoty Další možností jak posoudit symetrii výběrového rozdělení představuje vyjádření kvantilů a tzv. písmenových hodnot. Tyto charakteristiky zároveň poskytují informaci o procentuálním zastoupení prvků ve výběru. Z tabulky 1.2 je zřejmé, že pro případ stanovení Hg v játrech, leží 50 % hodnot, tj. 50 % prvků výběru pod koncentrací 2.99 mg kg -1, pro žebra a tuk je to pak koncentrace 0.124, resp. 0.109 mg kg -1. Pro játra pak obsah Hg nižší než 0.127 mg kg -1 obsahuje pouze 5 % výběru. 8

Tab. 1.2 Souhrn kvantilů pro analýzu výběru (a) játra, (b) žebra a (c) tuk Játra, n = 98 Procento 5 10 15 20 25 30 35 40 45 50 Kvantil 0.127 0.380 0.750 1.032 1.194 1.624 1.995 2.362 2.657 2.988 Procento 55 60 65 70 75 80 85 90 95 Kvantil 3.247 3.564 4.049 4.409 4.825 5.169 6.018 7.711 9.578 Žebra, n = 93 Procento 5 10 15 20 25 30 35 40 45 50 Kvantil 0.033 0.044 0.047 0.057 0.067 0.086 0.103 0.105 0.111 0.124 Procento 55 60 65 70 75 80 85 90 95 Kvantil 0.138 0.151 0.171 0.194 0.227 0.290 0.401 0.639 0.781 Tuk, n = 118 Procento 5 10 15 20 25 30 35 40 45 50 Kvantil 0.035 0.046 0.052 0.060 0.068 0.076 0.083 0.092 0.099 0.109 Procento 55 60 65 70 75 80 85 90 95 Kvantil 0.119 0.126 0.143 0.159 0.172 0.184 0.224 0.282 0.461 Písmenové hodnoty a kvantilové míry pro jednotlivé výběry jsou shrnuty v tabulce 1.3. Lišící se hodnoty kvantilových polosum (kvartilové, oktilové, sedecilové) indikují asymetrické rozdělení, v případě symetrického rozdělení by totiž všechny polosumy dosahovaly stejné hodnoty. Tab. 1.3 Vybrané kvantilové míry výběrů koncentrace Hg stanovené v játrech, žebrech a tuku Játra, n = 98 Dolní kvantil Polosuma Horní kvantil Medián M 2.988 Rozpětí Kvartil F 1.194 3.009 4.825 3.631 Oktil E 0.484 3.693 6.905 6.421 Sedecil D 0.131 4.474 8.817 8.686 Žebra, n = 93 Dolní kvantil Polosuma Horní kvantil Medián M 0.124 Rozpětí Kvartil F 0.067 0.147 0.227 0.158 Oktil E 0.046 0.254 0.462 0.416 Sedecil D 0.035 0.381 0.727 0.692 Tuk, n = 118 Dolní kvantil Polosuma Horní kvantil Medián M 0.109 Rozpětí Kvartil F 0.067 0.120 0.172 0.105 Oktil E 0.048 0.149 0.248 0.200 Sedecil D 0.037 0.208 0.430 0.393 9

1.4.3 Porovnání rozdělení Indikace lokální koncentrace dat a rozdělení výběrů byla posouzena na základě analýzy kvantilověkvantilového Q-Q grafu. Z hodnot uvedených v tabulce 1.4 je zřejmé, že jednotlivá rozdělení jsou asymetrická. Pro výběr analýzy jater a tuku vyplývá, že nejvyšší hodnoty korelačního koeficientu je dosaženo pro exponenciální rozdělení, pro případ analýzy žeber je výběrové rozdělení aproximováno nejlépe log-normálním. Tab. 1.4 Linearita v kvantil-kvantilovém (Q-Q) grafu y = β 0 + β 1 x : Játra, n = 98 Rozdělení Směrnice β 0 Úsek β 1 Korelační koeficient r xy Laplaceovo 2.325 3.706 0.9109 Normální 3.184 3.706 0.9040 Exponencionální 3.565 0.172 0.9905 Rovnoměrné 10.41-1.497 0.8651 Log-normální 1.840 0.751 0.9728 Žebra, n = 93 Rozdělení Směrnice β 0 Úsek β 1 Korelační koeficient r xy Laplaceovo 0.161 0.220 0.8455 Normální 0.217 0.220 0.8249 Exponencionální 0.262-0.039 0.9746 Rovnoměrné 0.695-0.127 0.7754 Log-normální 0.139-0.003 0.9815 Tuk, n = 118 Rozdělení Směrnice β 0 Úsek β 1 Korelační koeficient r xy Laplaceovo 0.088 0.150 0.8616 Normální 0.118 0.150 0.8419 Exponencionální 0.139 0.012 0.9696 Rovnoměrné 0.380-0.040 0.7901 Log-normální 0.0732 0.034 0.9640 1.5 Ověření předpokladů o datech Pro zajištění nevychýlených a správných odhadů klasických výběrových parametrů je zapotřebí, aby data splňovala požadované vlastnosti. K základním předpokladům o datech patří normalita, nezávislost a homogenita, tedy nepřítomnost vybočujících měření, odlehlých dat a hrubých chyb 5,6. Z výsledků uvedených v tabulce 1.5 vyplývá, že ani jeden z výběrů nevykazuje normální rozdělení, data jsou ve všech případech nezávislá a obsahují odlehlé body. 10

Tab. 1.5 Základní předpoklady a charakteristiky výběru (a) jater, (b) žeber a (c) tuku Játra, n = 98 Žebra, n = 93 Tuk, n = 118 Odhady klasických parametrů: Odhad aritmetického průměru: 3.71 0.220 0.150 Odhad rozptylu: 12.12 0.067 0.019 Odhad směrodatné odchylky: 3.48 2.596 0.139 Odhad šikmosti: 1.88 2.35 2.36 Odhad špičatosti: 7.16 8.75 8.55 Test normality: Tabulkový kvantil χ 2 1-α (2): 5.992 5.992 5.992 Odhad χ 2 exp statistiky: 146.05 245.27 290.5 Závěr: Předpoklad normality zamítnut zamítnut zamítnut Vypočítaná hladina významnosti α = 0.00 α = 0.00 α = 0.00 Test nezávislosti: Tabulkový kvantil t 1-α (n+1): 1.984 1.986 1.980 Odhad von Neumannovy statistiky t n : 1.487 0.656 1.492 Závěr: Předpoklad nezávislosti přijat přijat přijat Vypočítaná hladina významnosti α = 0.070 α = 0.256 α = 0.070 Detekce odlehlých hodnot metodou modifikované vnitřní hradby Dolní vnitřní hradba B D : Horní vnitřní hradba B H : Bod č. 37, 61, 64, 75 6, 8, 16, 19, 22, 24, 29, 30, 34, 85, 93 13, 21, 23, 30, 42, 45,48, 59, 115 Závěr: Počet odlehlých hodnot ve výběru 4 11 9 Odhady parametrů s vynechanými odlehlými hodnotami Odhad aritmetického průměru x: 3.20 0.137 0.116 Odhad rozptylu: 6.20 0.010 0.0045 Odhad směrodatné odchylky: 2.49 0.102 0.067 Odhad šikmosti: 1.05 1.56 0.97 Odhad špičatosti g: 4.27 5.56 3.72 1.6 Mocninná transformace Jelikož bylo na základě průzkumové analýzy dat zjištěno, že se rozdělení všech tří studovaných výběrů systematicky odlišují od rozdělení normálního, není vhodné pro jejich popis volit nerobustních odhadů. Ačkoli robustní odhady do značné míry eliminují problémy spojené s přítomností odlehlých bodů a asymetrií v datech, nemusí být tento postup vždy korektní, jelikož robustnost spočívá v přiblížení se k přijatému modelu měření bez ohledu na jeho platnost 5,6. Případnou asymetrii v datech není možné eliminovat odstraněním odlehlých bodů, jelikož vzhledem k charakteru experimentu odstranění podezřelých bodů možné není. Jednotlivá data představují cenné informace, jejichž ztráta by v konečném důsledku mohla vést ke zcela chybné interpretaci výsledků. V takovém případě je vhodné provést transformaci dat, která vede ke stabilizaci rozptylu a zesymetričtění rozdělení. Oprávněnost Box-Coxovy a prosté mocninné transformace pro jednotlivé výběry (játra, žebra, tuk) dokumentuje obr. 1.2, resp. 1.3. Graf logaritmu věrohodnostní funkce, který slouží pro posouzení 11

významu Box-Coxovy transformace a zároveň pro odhad parametru λ v Boxově-Coxově transformaci jasně dokazuje nutnost transformace. Odhad λ indikuje souřadnice x maxima křivky věrohodnostní funkce ln L(λ) ve zvoleném intervalu. Volbu optimálního parametru mocninné transformace a význam jejího posouzení dokumentuje graf průběhu šikmosti pro exponenciální transformaci (obr. 1.3). Obrázek 1.2 a 1.3 dále znázorňuje vliv obou z uvedených typů transformací na kvalitu dat prostřednictvím Q-Q kvantilových grafů. Hodnoty odhadů vybraných výběrových parametrů pro původní data a pro data po transformaci shrnuje tabulka 1.6. Z ní je patrný vliv nejen na parametry výběrové šikmosti a špičatosti, ale dokumentuje i retransformované hodnoty opravených výběrových průměrů, apod. log L Box-Coxova transformace - Věrohodnost - Úloha 1 log L Box-Coxova transformace - Věrohodnost - Úloha 1 A 200 100 300 200-0 100-0 -100-100 -200-200 -300-300 -400-23.0-22.0-21.0-20.0-19.0-18.0-17.0-16.0-15.0-14.0-13.0-12.0 Parametr -400-23.0-22.0-21.0-20.0-19.0-18.0-17.0-16.0-15.0-14.0-13.0-12.0 Parametr Kvantil-Data Box-Coxova transformace - Q-Q bez transformace - Úloha 1 Kvantil-Data Box-Coxova transformace - Q-Q bez transformace - Úloha 1 B 5.0 4.0 4.0 3.0 3.0 2.0 2.0 1.0 1.0 0.0 0.0-1.0-1.0-2.0-2.0-3.0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 Kvantil-Norm -3.0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 Kvantil-Norm Kvantil-Data Box-Coxova transformace - Q-Q po transformaci - Úloha 1 Kvantil-Data Box-Coxova transformace - Q-Q po transformaci - Úloha 1 C 3.0 2.0 3.0 2.0 1.0 1.0 0.0 0.0-1.0-1.0-2.0-2.0-3.0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 Kvantil-Norm -3.0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 Kvantil-Norm R. hust. Box-Coxova transformace - Hustota - Úloha 1 R. hust. Box-Coxova transformace - Hustota - Úloha 1 D 4.0E13 3.0E13 3.0E13 2.0E13 2.0E13 1.0E13 1.0E13 0.0E13-0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 Žebra 0.0E13-0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Tuk Obr. 1.2. (A) Graf věrohodnosti Box-Coxovy transformace, (B) a (C) Q-Q graf před, resp. po Box-Coxově transformaci, (D) Graf hustoty 12

Šikmost Exponenciální transformace - Šikmost - Úloha 1 Šikmost Exponenciální transformace - Šikmost - Úloha 1 Šikmost Exponenciální transformace - Šikmost - Úloha 1 A 10 10.0 9.0 8.0 7.0 8 8.0 6.0 7.0 6 6.0 5.0 5.0 4.0 4 4.0 3.0 2 3.0 2.0 2.0 0 1.0 1.0 0.0 0.0-2 -4.0-3.0-2.0-1.0 0.0 1.0 2.0 Parametr Parametr -1.0-4.0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 Parametr -1.0-4.0-3.0-2.0-1.0 0.0 1.0 2.0 Kvantil-Data Exponenciální transformace - Q-Q bez transformace - Úloha 1 Kvantil-Data Exponenciální transformace - Q-Q bez transformace - Úloha 1 B 5.0 4.0 3.0 4.0 3.0 2.0 2.0 1.0 1.0 0.0 0.0-1.0-1.0-2.0-2.0-3.0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 Kvantil-Norm -3.0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 Kvantil-Norm Kvantil-Data Exponenciální transformace - Q-Q po transformaci - Úloha 1 Kvantil-Data Exponenciální transformace - Q-Q po transformaci - Úloha 1 Kvantil-Data Exponenciální transformace - Q-Q po transformaci - Úloha 1 C 3.0 3.0 3.0 2.0 2.0 2.0 1.0 1.0 1.0 0.0 0.0 0.0-1.0-1.0-1.0-2.0-2.0-2.0-3.0 Kvantil-Norm -3.0 Kvantil-Norm -3.0 Kvantil-Norm -3.0-2.0-1.0 0.0 1.0 2.0 3.0-3.0-2.0-1.0 0.0 1.0 2.0 3.0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 R. hust. Exponenciální transformace - Hustota - Úloha 1 R. hust. Exponenciální transformace - Hustota - Úloha 1 R. hust. Exponenciální transformace - Hustota - Úloha 1 D 0.50 0.50 0.60 0.50 0.40 0.40 0.40 0.30 0.30 0.30 0.20 0.20 0.20 0.10 0.10 0.10 0.00 Játra 0.00 Žebra 0.00 Tuk -10 0 10 20 30 40-2 0 2 4 6 8 10 12 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 Obr. 1.3 (A) Graf průběhu šikmosti pro exponenciální transformaci (B) a (C) Q-Q graf před, resp. po exponcionální transformaci, (D) Graf hustoty 13

Tab. 1.6 Mocninná a Box-Coxova transformace dat ADSTAT Játra, n = 98 Žebra, n = 93 Tuk, n = 118 Odhady parametrů původních dat: Odhad aritmetického průměru 3.706 0.220 0.150 Odhad směrodatné odchylky 12.12 0.260 0.139 Odhad mediánu 2.988 0.124 0.109 Odhad šikmosti 1.88 2.35 2.36 Odhad špičatosti 7.16 8.75 8.55 Prostá mocninná transformace: Odhad optimálního exponentu 0.40-0.13-0.13 Odhad průměru transformovaných dat 1.52 1.32 1.35 Odhad směrodatné odchylky transf. dat 0.62 0.166 0.136 Odhad šikmosti transformovaných dat 0.186-0.032 0.167 Odhad špičatosti transformovaných dat 3.026 2.665 3.58 Opravený odhad průměru původních dat 2.826 0.127 0.107 Oprávněnost transformace ANO ANO ANO Boxova-Coxova transformace: Odhad optimálního exponentu 0.40-0.13-0.13 Odhad průměru transformovaných dat 1.29-2.606 Odhad směrodatné odchylky transf. dat 1.55 1.24 1.019 Odhad šikmosti transformovaných dat 0.186 0.032-0.167 Odhad špičatosti transformovaných dat 3.026 2.665 3.58 Opravený odhad průměru původních dat 2.826 0.127 0.107 Oprávněnost transformace ANO ANO ANO QC-Expert Prostá mocninná transformace: Odhad optimálního exponentu 0.99 2.37 1.56 Opravený odhad průměru původních dat 2.734 0.125 0.107 Dolní interval spolehlivosti 2.300 0.107 0.095 Horní interval spolehlivosti 3.229 0.145 0.120 Doporučená hodnota spodní varovné meze 0.00 0.017 0.024 Doporučená hodnota horní varovné meze. 14.59 1.604 0.621 Oprávněnost transformace ANO ANO ANO Boxova-Coxova transformace: Odhad optimálního exponentu -15.35-17.63-17.47 Odhad průměru transformovaných dat 2.907 0.162 0.119 Doporučená hodnota spodní varovné meze 0.970 0.044 0.054 Doporučená hodnota horní varovné meze. 5.997 0.341 0.219 Oprávněnost transformace ANO ANO ANO 1.7 Konfirmatorní analýza dat Na základě výše uvedených údajů byly zvoleny vybrané statistické parametry charakterizující jednotlivá výběrová rozdělení. Statistické charakteristiky stanovení obsahu rtuti v lyofilizovaných 14

vzorcích jater, žeber a tuku vypočtené programem QC-Expert shrnuje tabulka 1.7. Vybrané parametry by měly dostatečným způsobem sloužit pro charakterizaci výběru a další interpretaci analytických výsledků. Tab. 1.7 Statistické charakteristiky stanovení obsahu Hg (mg kg -1 ) v lyofilizovaných játrech, žebrech a tuku uhynulých vyder říčních Játra Žebra Tuk Počet vzorků 98 93 118 Počet odlehlých hodnot 4 11 9 Minimum 0.094 0.025 0.008 Maximum 20.34 0.94 0.78 Průměr a 2.73 0.125 0.107 Spodní mez intervalu spolehlivosti a 2.30 0.107 0.095 Horní mez intervalu spolehlivosti a 3.23 0.145 0.120 Rozptyl 12.12 0.067 0.019 Směrodatná odchylka 3.48 0.260 0.139 Medián 2.99 0.124 0.109 Spodní mez intervalu spolehlivosti mediánu 2.16 0.096 0.092 Horní mez intervalu spolehlivosti mediánu 3.82 0.152 0.126 Šikmost 1.88 2.35 2.36 Špičatost 7.16 8.75 8.55 p (test normality) b 1.43 10-4 3.24 10-5 9.28 10-6 a Odhad parametru získaný po exponencionální transformaci dat. b Kombinovaný test normality: Jestliže je p větší než 0.05, rozdělení lze považovat za normální, pokud je hodnota p nižší než 0.05 data nevykazují normální rozložení. 1.8 Závěr Analyzováno bylo 98 vzorků lyofilizovaných jater, 93 vzorků žeber a 118 vzorků tuku vyder říčních pro potřeby stanovení Hg. Vzorky byly shromažďovány a odebírány z těl uhynulých jedinců, nebylo tedy často možné z důvodu vysokého stupně biologického rozkladu odebrat ve všech případech vždy všechny tři uvedené typy vzorku. Z uvedeného důvodu není počet prvků ve všech výběrech stejný. Z výsledků exploratorní analýzy experimentálních dat vyplynulo, že data nevykazují normální rozdělení. Zejména v případě analýzy jater byl v datech pozorován výrazný rozptyl. Jednotlivé výběry obsahují odlehlé hodnoty. V případě výběru obsahujícího údaje o koncentraci rtuti v játrech se jedná o vzorky 306, 471, 478, 360 s výrazně vyšší koncentrací Hg ve srovnání s ostatními. Značení vzorků odpovídá kódům uvedeným v databází 2,3 společnosti ALKA Wildlife, o.p.s., ČR. Nejvyšší koncentrace Hg byly nalezeny ve vzorcích jater, a to pro vzorky č. 471 a 478. Vzorek č. 471 byl nalezen v úseku dálnice D1 na 75 km, žádné další informace o vzorku nevíme. Vzorek 478 byl nalezen v obci Šabina, jednalo se o samce, příčinou úmrtí byla srážka s dopravním prostředkem. Zajímavostí je, že v dané lokalitě povodí Ohře byly pozorovány výrazně zvýšené koncentrace Hg ve vodách, sedimentu či rybách 7. Z výsledků je zřejmé, že nejvyšší koncentrace Hg byly stanoveny v játrech. Průměrná koncentrace rtuti získaná po exponencionální transformaci dat byla 2.73 mg kg -1, přičemž 15

pro netransformovaná sešikmená data činila tato hodnota 3.71 mg kg -1. Ve srovnání s aritmetickým průměrem je opravený průměr v těsném souhlasu s robustním odhadem mediánu, který činí 2.99 mg kg -1, což dokládá potřebu a význam transformace. Podobných závěrů bylo dosaženo i pro případ analýzy žeber a tuku. Výsledky statistické analýzy velkých výběrů v daném případě demonstrují význam využití matematické transformace vstupních dat v oblasti analýzy biologických vzorků při určení vybraných statistických charakteristik, namísto často preferovaného odstranění odlehlých hodnot, které může vést v konečném důsledku ke ztrátě cenných informací. 1.9 Literatura 1. Směrnice Rady č. 92/43/EHS z 21. května 1992 o ochraně přírodních stanovišť, v.ž.ž.a.p.r.r. 2. Větrovcová J., Poledníková K., Poledník L., Beran V., Hlaváč V.: Databáze údajů o uhynulých jedincích vydry říční v ČR. Ochrana přírody 4, 15 19 (2011). 3. Beran V.: Protokoly o uhynulých jedincích pro databázi společnosti ALKA Wildlife, o.p.s., ČR. Nepublikované materiály (2014). 4. Nováková L., Husáková L., Urbanová I., Šrámková J., Beran V., Sborník příspěvků Studentská vědecká odborná činnost 2013/2014, str. 143 148. Univerzita Pardubice, Pardubice 2014; ISBN: 978-80-7395-819-0. 5. Meloun M., Militký J.: Kompendium statistického zpracování dat, Vyd. 3., nakl. Karolinum, Praha, 2012. ISBN: 978-80-246-2196-8. 6. Meloun M., Militký J.: Interaktivní statistická analýza dat, Vyd. 3., nakl. Karolinum, Praha, 2012. ISBN: 978-80-246-2173-9. 7. http://www.poh.cz/dotacni_tituly/170_studie.pdf, citováno 8. 1. 2015. 16

2 Statistická analýza malých výběrů dle Horna 2.1 Zadání Správnost prvkové analýzy jater za využití vybraných metod atomové spektrometrie Správnost stanovení 16 vybraných elementů (Hg, Li, Mn, Co, As, Se, Rb, Sr, Mo, Cd, Sb, Cs, Pb, Na, K, Mg) ve vzorcích jater analyzovaných termooxidační metodou (Hg), metodou atomové absorpční či emisní spektrometrie (Na, K, Mg) a hmotnostní spektrometrie s ionizací v indukčně vázaném plazmatu (Li, Mn, Co, As, Se, Rb, Sr, Mo, Cd, Sb, Cs, Pb) byla ověřena na základě analýzy certifikovaného referenčního materiálu (CRM) jater NIST 1577c Bovine Liver (National Institute of Standards and Technology, USA). Cílem bylo určit střední hodnoty koncentrace jednotlivých elementů, parametry rozptýlení, 95% interval spolehlivosti středních hodnot a na hladině významnosti 0.05 provést test správnosti stanovení vybraných elementů za využití dostupného CRM, tj. určit, zda navržené a optimalizované analytické metody poskytují správné výsledky. Certifikované hodnoty obsahu jednotlivých elementů deklarovaných výrobcem CRM jsou uvedeny v tabulce 2.1. Tab. 2.1 Certifikované hodnoty ( g kg -1 ) 16 vybraných elementů v CRM materiálu jater NIST 1577c Hg Li Mn Co As Se Rb Sr 12 10460 300 19.6 2031 35300 95.3 Mo Cd Sb Cs Pb Na a K a Mg a 3300 97 3.13 21.7 62.8 2033 10230 620 a koncentrace mg kg -1 2.2 Data Tab. 2.2 Koncentrace ( g kg -1 ) a 16 vybraných elementů stanovená v CRM materiálu jater NIST1577c Analyt n Koncentrace g kg -1 Hg 8 5.79 4.91 4.82 4.88 5.70 4.16 6.70 4.87 Li 5 12.1 13.0 13.2 12.2 12.5 Mg 5 619.1 602.0 621.8 626.2 595.6 a koncentrace mg kg -1 pro Na, K, Mg 2.3 Použitý software Data byla analyzována pomocí statistického programu QC-Expert 2.5 (TriloByte Statistical Software, s.r.o., ČR). 17

2.4 Řešení U malých výběrů 4 n 20 poskytuje správné odhady střední hodnoty Hornův postup pivotů. Pivotová polosuma a pivotové rozpětí umožňují vyčíslit i intervalový odhad střední hodnoty a navíc jsou oba odhady dostatečně robustní vůči asymetrii rozdělení malého výběru a i vůči odlehlým hodnotám. Dostupná data týkající se analýzy CRM obsahovala maximální počet 8 výsledků pro případ stanovení rtuti, pro ostatní analyzované prvky pak bylo k dispozici menší množství výsledků, minimálně však čtyři. Malý počet dat je dán zejména vysokou cenou CRM. Ta je nejen limitujícím faktorem dostupnosti materiálu, ale často i počtu provedených opakování. Pro uvedené soubory dat obsahující omezené množství analytických výsledků celá řada testů selhává. Exploratorní analýza dat za využití grafických diagnostik nemůže poskytnout dokonalou představu struktury dat, nevěrohodné mohou být rovněž závěry základních předpokladů analýzy dat, tj. testu normality, nezávislosti či homogenity. Z těchto důvodů je použití Hornova postupu analýzy malých výběrů zřejmé. Postup řešení analýzy malých výběrů obsahujících sudý, resp. lichý počet prvků je názorně demonstrován pro případ stanovení Hg (n = 8) a stanovení Cs (n = 7). Pro ostatní elementy byla analýza provedena za využití programu QC-Expert. 2.4.1 Analýza souboru s lichým počtem prvků Stanovení Cs (n = 7) 1. Pořádkové statistiky i 1 2 3 4 5 6 7 x i 21.3 21.7 21.8 22.3 22.4 22.5 22.9 2. Hloubka pivotu H = integer n + 1 2 2 H = integer(2.0) H = 2 3. Pivoty Dolní pivot x D = x H = x 2 = 21.7 Horní pivot x H = x n 1-H = x 6 = 22.5 18

4. Pivotová polosuma P L = x D + x H 2 P L = P L = 22.1 21.7 + 22.5 2 5. Pivotové rozpětí R L = x H x D R L = 22.5 21.7 R L = 0.8 6. 95% interval spolehlivosti střední hodnoty µ: t L,1 (7) = 0.720 2 P L R L x t L,1 (n) P L + R L x t L,1 (n) 2 2 22.1 0.8 x 0.720 22.1 + 0.8 x 0.720 21.5 22.7 2.4.2 Analýza souboru se sudým počtem prvků Stanovení Hg (n = 8) 1. Pořádkové statistiky i 1 2 3 4 5 6 7 8 x i 4.16 4.82 4.87 4.88 4.91 5.70 5.79 6.70 2. Hloubka pivotu n + 1 H = integer 2 + 1 2 H = integer(2.75) H = 2 19

3. Pivoty Dolní pivot x D = x H = x 2 = 4.82 Horní pivot x H = x n 1-H = x 7 = 5.79 4. Pivotová polosuma P L = x D + x H 2 P L = 4.82 + 5.79 2 P L = 5.305 5. Pivotové rozpětí R L = x H x D R L = 5.79 4.82 R L = 0.97 6. 95% interval spolehlivosti střední hodnoty µ: t L,1 (8) = 0.564 2 P L R L x t L,1 2 (n) P L + R L x t L,1 2 (n) 5.305 0.97 x 0.564 5.305 + 0.97 x 0.564 4.76 5.86 2.4.3 Analýza malých výběrů za využití programu QC-Expert Statistické charakteristiky stanovení ostatních elementů v CRM jater NIST 1577c byly určeny za využití programu QC-Expert a jsou shrnuty v tabulce 2.3. Tabulka dokumentuje vybrané parametry za využití klasických odhadů, robustních odhadů i odhadů analýzy malých výběrů. V převážné většině případů se jednotlivé bodové odhady příliš neodlišují. 20

Tab. 2.3 Statistické charakteristiky stanovení vybraných elementů ( g kg -1 ) v CRM jater NIST 1577c Hg Li Mn Co As Se Rb Sr Analýza malých výběrů: n = 8 n = 5 n = 5 n = 5 n = 4 n = 4 n = 5 n = 4 Střední hodnota 5.31 12.6 10294 307.5 19.6 2008 34981 94.35 Spodní mez (2.5%) 4.76 10.92 9369 297.2 18.41 1971 33226 90.14 Horní mez (97.5%) 5.85 14.28 11220 317.7 20.78 2045 36736 98.56 Pivotové rozpětí 0.97 0.80 442 4.90 1.60 50 838 5.7 Robustní parametry: Medián 4.90 12.50 10466 307.0 20.05 2011 35071 92.55 IS spodní 3.36 11.72 10003 291.2 18.75 1970 34028 87.92 IS horní 6.43 13.28 10929 322.8 21.35 2052 36114 97.18 Mediánový rozptyl 0.42 0.08 27836 32.4 0.17 162.7 141205 2.11 Klasické parametry: Průměr 5.23 12.60 10371 307.5 19.83 2010 35076 93.5 Spodní mez 4.57 11.99 10012 297.5 18.69 1975 34322 89.3 Horní mez 5,89 13.20 10730 317.6 20.96 2044 35829 97.6 Rozptyl 0.62 0.24 83526 65.3 0.71 462.3 36817 6.70 Šikmost 0.64 0.22-0.044 0.13-0.88-0.20 0.27 0.94 Špičatost 2.61 1.38 1.45 2.28 2.11 1.68 1.68 2.15 Tab. 2.3 Pokračování: Mo Cd Sb Cs Pb Na a K a Mg a Analýza malých výběrů: n = 6 n = 4 n = 6 n = 7 n = 4 n = 4 n = 4 n = 5 Střední hodnota 3337 97.8 3.01 22.1 64.50 1928 9721 611.9 Spodní mez 3260 93.8 2.70 21.5 55.64 1791 8710 570.4 Horní mez 3414 101.8 3.32 22.7 73.36 2064 10730 653.4 Pivotové rozpětí 74 5.4 0.3 0.8 12.0 185 1369 19.8 Robustní parametry: Medián 3357 96.45 2.94 22.3 63.65 1971 9835 619.1 IS spodní 3253 92.07 2.65 21.3 53.91 1820 8723 597.4 IS horní 3461 100.8 3.22 23.3 73.40 2121 10946 640.8 Mediánový rozptyl 1645 1.90 0.012 0.17 9.37 2227 121969 60.9 Klasické parametry: Průměr 3337 97.13 3.00 22.1 64.08 1949 9778 612.9 Spodní mez 3275 93.28 2.82 21.6 56.24 1816 8814 596.4 Horní mez 3398 100.97 3.20 22.6 71.91 2082 10741 629.5 Rozptyl 3440 5.84 0.031 0.30 24.26 6941 366560 178.2 Šikmost -0.86 0.74 0.72-0.16 0.30-0.65-0.23-0.38 Špičatost 2.40 1.96 1.88 1.91 2.02 1.86 1.56 1.41 a koncentrace mg kg -1 21

2.5 Závěr Jelikož se pro všechny sledované elementy (Hg, Li, Mn, Co, As, Se, Rb, Sr, Mo, Cd, Sb, Cs, Pb, Na, K, Mg) certifikovaná, tj. správná hodnota nachází v intervalu spolehlivosti, který byl pro jednotlivé prvky vyčíslen všemi výše uvedenými způsoby, je stanovení možné považovat za správné. 2.6 Literatura 1. Meloun M., Militký J.: Kompendium statistického zpracování dat, Vyd. 3., nakl. Karolinum, Praha, 2012. ISBN: 978-80-246-2196-8. 2. Meloun M., Militký J.: Interaktivní statistická analýza dat, Vyd. 3., nakl. Karolinum, Praha, 2012. ISBN: 978-80-246-2173-9. 22

3 Statistické testování 3.1 Test správnosti 3.1.1 Zadání Ověření správnosti postupu mikrovlnné extrakce pro potřeby následné prvkové analýzy polétavého popílku metodou ICP-MS Pro přípravu vzorku polétavého popílku pro potřeby následné anorganické prvkové analýzy metodou ICP-MS byl navržen časově úsporný a ekologicky šetrný postup mikrovlnné extrakce. Správnost navrženého postupu pro stanovení 5 vybraných elementů (Li, Be, Se, Sb, W) metodou ICP-MS byla ověřena na základě analýzy certifikovaného referenčního materiálu (CRM) polétavého popílku Fine Fly Ash CTA-FFA-1 (IChTJ, Polsko). Cílem bylo provést na hladině významnosti 0.05 test správnosti stanovení vybraných elementů za využití dostupného CRM, tj. určit, zda postup optimalizované analytické metody poskytuje správné výsledky. Certifikované hodnoty obsahu jednotlivých elementů deklarovaných výrobcem CRM jsou uvedeny v tabulce 3.1.1. Tab. 3.1.1 Certifikované hodnoty (mg kg -1 ) 5 vybraných elementů v CRM materiálu polétavého popílku CTA-FFA-1 Li Be Se Sb W 128 27 4.6 17.6 10.5 3.1.2 Data Tabulka 3.1.2: Koncentrace Li, Be, Se, Sb, W (mg kg -1 ) v CRM CTA-FFA-1 (n = 24) stanovená po mikrovlnné extrakci vzorku metodou ICP-MS (a) Lithium, n = 24 116.9 127.1 115.3 138.2 119.8 134.9 139.2 127.2 133.7 115.6 125.7 118.7 139.8 122.4 123.1 126.0 139.3 138.9 132.0 135.2 118.0 130.4 130.2 126.6 (b) Beryllium, n = 24 28.2 28.5 28.1 23.6 26.7 25.4 24.3 27.8 25.9 25.7 30.5 26.1 26.4 24.0 25.1 24.9 26.9 23.3 29.8 26.1 28.0 25.5 26.0 27.5 (c) Selen, n = 24 3.88 4.11 4.66 5.12 3.92 4.73 4.17 5.32 4.53 4.59 4.09 4.29 4.56 4.64 4.80 3.82 4.76 4.95 4.53 5.40 4.80 5.07 4.93 4.26 (d) Antimon, n = 24 20.1 17.0 18.2 14.3 17.6 19.0 19.1 20.5 17.2 19.1 21.0 15.0 16.6 17.4 18.7 19.4 16.5 17.4 18.8 16.5 15.2 18.4 17.1 16.8 (e) Wolfram, n = 24 10.46 9.97 11.21 9.60 10.07 9.71 10.11 10.16 10.88 11.08 10.30 9.70 10.27 11.11 10.35 9.98 10.78 10.65 10.36 10.70 11.81 10.57 10.80 10.83 23

3.1.3 Použitý software Data byla zpracována za využití statistického programů ADSTAT 1.25 (TriloByte Statistical Software, s.r.o., ČR). 3.1.4 Ověření předpokladů o datech Výsledky testování normality jednotlivých výběrů, nezávislosti a přítomnosti odlehlých bodů jsou uvedeny v tabulce 3.1.3. Z uvedených výsledků je zřejmé, že ve všech případech data vykazují normální rozdělení, jsou nezávislá a neobsahují odlehlé hodnoty. Pro určení středních hodnot a vyčíslení 95% intervalu spolehlivosti středních hodnot lze použít klasických parametrických odhadů. Tab. 3.1.3: Testy základních předpokladů pro výběry (n = 24) koncentrace Li, Be, Se, Sb, W (mg kg -1 ) v CRM CTA-FFA-1 Li Be Se Sb W Test normality: tabulkový kvantil χ 2 1-α (2): 5.992 5.992 5.992 5.992 5.992 Odhad χ 2 exp statistiky: 1.913 0.550 0.608 0.181 0.862 Závěr: Předpoklad normality přijat přijat přijat přijat přijat Vypočtená hladina významnosti α = 0.384 α = 0.760 α = 0.738 α = 0.914 α = 0.650 Test nezávislosti: tabulkový kvantil t 1- α/2 (n+1): 2.060 2.060 2.060 2.060 2.060 Odhad von Neumannovy statistiky t n : 0.894 1.529 0.028 0.144 0.629 Závěr: Předpoklad nezávislosti přijat přijat přijat přijat přijat Vypočtená hladina významnosti α = 0.190 α = 0.07 α = 0.489 α = 0.443 α = 0.268 Detekce odlehlých hodnot metodou modifikované vnitřní hradby Dolní vnitřní hradba B D : Horní vnitřní hradba B H : Závěr: Počet odlehlých hodnot ve výběru 0 0 0 0 0 24

3.1.5 Vyčíslení odhadů výběrových parametrů Odhady vybraných klasických i robustních parametrů stanovení prvků v CRM polétavého popílku jsou shrnuty v tabulce 3.1.4. Odhady robustních parametrů jsou v tabulce 3.1.4 uvedeny navzdory skutečnosti, že data splňují výběrové předpoklady použití klasických parametrických odhadů a pro testování lze tak použít intervalový odhad aritmetického průměru. Tab. 3.1.4 Statistické charakteristiky stanovení vybraných elementů (mg kg -1 ) v CRM CTA-FFA-1 Li Be Se Sb W Klasické parametry: Průměr 128.1 26.4 4.58 17.8 10.48 Spodní mez IS 124.6 25.6 4.39 17.1 10.25 Horní mez IS 131.5 27.2 4.77 18.5 10.70 Rozptyl 66.7 3.46 0.196 2.91 0.29 Šikmost -0.049 0.303-0.040-0.09 0.40 Špičatost 1.74 2.55 2.19 2.49 2.90 Robustní parametry: Medián 127.2 26.1 4.61 17.5 10.41 IS spodní 121.8 25.1 4.39 16.3 10.07 IS horní 132.5 27.1 4.84 18.6 10.75 Mediánový rozptyl 9.3 5.9 0.38 4.30 0.50 IS 95% interval spolehlivosti 3.1.6 Závěr Vzhledem k tomu, že ve všech případech obsahovaly intervaly spolehlivosti aritmetického průměru stanovení jednotlivých elementů certifikovanou hodnotu deklarovanou výrobcem referenčního materiálu CRM CTA-FFA-1, lze navrženou metodu využívající mikrovlnné extrakce pro přípravu vzorků polétavého popílku pro potřeby následného stanovení Li, Be, Se, Sb a W metodou ICP-MS považovat za správnou. Správnou hodnotu zahrnují i intervaly spolehlivosti robustních odhadů, což rovněž potvrzuje správnost analytického postupu. 3.1.7 Literatura 1. Meloun M., Militký J.: Kompendium statistického zpracování dat, Vyd. 3., nakl. Karolinum, Praha, 2012. ISBN: 978-80-246-2196-8. 2. Meloun M., Militký J.: Interaktivní statistická analýza dat, Vyd. 3., nakl. Karolinum, Praha, 2012. ISBN: 978-80-246-2173-9. 25

3.2 Test shodnosti 3.2.1 Zadání Porovnání koncentrace Hg ve vzorcích vydřích tkání Provedeno bylo stanovení Hg v lyofilizovaných vzorcích kostí (n = 93) a tuku (n = 74) uhynulých vyder říčních termooxidační metodou. Cílem bylo určit, zda je rozdíl v koncentraci rtuti v uvedených typech vzorků na hladině významnosti 0.05 statisticky významný. 3.2.2 Data Tabulka 3.2.1: Koncentrace Hg (mg kg -1 ) ve vzorcích kostí (n = 93) a tuku (n = 74) vyder říčních stanovená termooxidační metodou (a) Kosti, n = 93 0.047 0.124 0.030 0.242 0.103 0.941 0.052 1.419 0.451 0.186 0.318 0.797 0.336 0.159 0.171 0.058 0.103 0.191 0.044 0.647 (b) Tuk, n = 74 0.135 0.083 0.026 0.131 0.176 0.184 0.262 0.159 0.160 0.109 0.098 0.106 0.184 0.228 0.124 0.057 0.153 0.048 0.159 0.092 3.2.3 Použitý software Data byla vyhodnocena pomocí statistického programů ADSTAT 1.25 (TriloByte Statistical Software, s.r.o., ČR). 3.2.4 Ověření předpokladů o datech Výsledky testování normality jednotlivých výběrů, nezávislosti a přítomnosti odlehlých bodů jsou uvedeny v tabulce 3.2.2. V tabulce jsou mj. uvedeny i vybrané výběrové parametry. 26

Tab. 3.2.2: Testy výběrových předpokladů a vybrané parametry charakterizující výběr kostí a tuku Kosti, n = 93 Tuk, n = 74 Odhady klasických parametrů: Odhad aritmetického průměru: 0.220 0.135 Odhad rozptylu: 0.067 0.009 Odhad směrodatné odchylky: 2.596 0.096 Medián: 0.124 0.109 Opravený průměr (mocninná transform): 0.127 0.112 Odhad šikmosti: 2.35 2.16 Odhad špičatosti: 8.75 9.12 Test normality: tabulkový kvantil χ 2 1-α (2): 5.992 5.992 Odhad χ 2 exp statistiky: 245.27 207.0 Závěr: Předpoklad normality: zamítnut zamítnut Vypočtená hladina významnosti: α = 0.00 α = 0.00 Test nezávislosti: tabulkový kvantil t 1- α/2 (n+1): 1.986 1.992 Odhad von Neumannovy statistiky t n : 0.656 0.644 Závěr: Předpoklad nezávislosti přijat přijat Vypočtená hladina významnosti α = 0.256 α = 0.261 Detekce odlehlých hodnot metodou modifikované vnitřní hradby Dolní vnitřní hradba B D : Horní vnitřní hradba B H : 6, 8, 16, 19, 22, 24, 29, 30, 13, 21, 23 34, 85, 93 Závěr: Počet odlehlých hodnot ve výběru 11 3 3.2.5 Test shody rozptylů Vzhledem k tomu, že oba výběry nevykazují normální rozdělení, obsahují odlehlé hodnoty a mají nestejný rozsah, bylo pro testování shodnosti rozptylů použito robustního Jacknife F-testu. Jak je z výsledků uvedených v tabulce 3.2.3 zřejmé, že F statistika tabulkový kvantil F ( 1- α/2, Df1, Df2) a hypotéza H 0 : s 1 2 = s 2 2 je zamítnuta. Rozptyly obou výběrů je tedy nutné považovat za rozdílné. Tab. 3.2.3: Jacknife F-test homogenity rozptylů Hypotéza H 0 : s 2 2 1 = s 2 Počet stupňů volnosti Df1 2 Počet stupňů volnosti Df2 165 Tabulkový kvantil F ( 1- α/2, Df1, Df2): 3.773 F-statistika 15.569 Závěr: H 0 zamítnuta Rozptyly se považují za rozdílné Vypočtená hladina významnosti 0.000 27

3.2.6 Test shody středních hodnot dvou souborů Pro testování shodnosti průměrů bylo použito robustního t-testu pro výběry s rozdílnými rozptyly. Jak je zřejmé z výsledků uvedených v tabulce 3.2.4, je t statistika tabulkový kvantil F ( 1- α/2, Df1) a hypotéza H 0 : 1 = 2 je přijata. Průměry obou výběrů je tedy možné považovat za shodné. Tab. 3.2.4: Robustní t-test shodnosti průměrů pro výběry s rozdílnými rozptyly Hypotéza H 0 : 1 = 2 Počet stupňů volnosti Df1 103 Tabulkový kvantil F ( 1- α/2, Df1): 1.983 t-statistika 1.685 Závěr: H 0 přijata Průměry se považují za shodné Vypočtená hladina významnosti 0.095 3.2.7 Závěr Jelikož oba testované výběry nevykazují normální rozdělení a obsahují odlehlé hodnoty, byl pro testování shodnosti rozptylů použit robustní Jacknife F-test. Na základě výsledku uvedeného testu byla nulová hypotéza H 0 : s 1 2 = s 2 2 o shodnosti rozptylů na hladině významnosti 0.05 zamítnuta a rozptyly obou výběrů jsou rozdílné. Pro testování shodnosti průměrů obou výběrů byl použit robustní t-test shodnosti průměrů pro výběry s rozdílnými rozptyly. Na hladině významnosti 0.05 byla nulová hypotéza o shodnosti průměru H 0 : 1 = 2 přijata a průměry lze považovat za shodné. Koncentrace Hg ve vzorcích kostí se statisticky významně neodlišuje od koncentrace stanovené v tuku. V daném ohledu, tj. z hlediska monitorování koncentrace rtuti není nezbytné provádět analýzu obou typů tkání, což může být přínosné z hlediska ekonomického i časového. 28

3.3 Párový test 3.3.1 Zadání Validace metody TOF-ICP-MS pro analýzu kyseliny sírové pomocí referenční metody HR-ICP-MS Navržena a optimalizována byla metoda pro prvkovou analýzu kyseliny sírové metodou hmotnostní spektrometrie s ionizací v indukčně vázaném plazmatu na instrumentaci s průletovým analyzátorem iontů (TOF-ICP-MS) po modifikaci matrice vzorku pomocí bromidu barnatého. Uvedený postup umožnuje separovat síranovou matrici a odstranit tak spektrální interference polyatomických iontů se sírou, které jsou limitujícím faktorem dosažení správných výsledků na daném typu instrumentace. Provedena byla prvková analýza kyseliny sírové pomocí navržené metody a výsledky byly srovnány s hodnotami dosaženými pomocí vysokorozlišovací hmotnostní spektrometrie s ionizací v indukčně vázaném plazmatu (HR-ICP-MS), která je schopna výše uvedené interference účinně eliminovat. Cílem bylo určit, zda se výsledky analýzy H 2 SO 4 významně neodlišují od výsledků dosažených pomocí referenční metody, tj. zda obě metody poskytují na hladině významnosti 0.05 stejné výsledky. 3.3.2 Data Tabulka 3.3.1: Výsledky prvkové analýzy kyseliny sírové ( g L -1 ) stanovené referenční metodou HR- ICP-MS a pomocí navržené TOF-ICP-MS metody HR-ICP-MS 0.43 0.72 0.31 0.44 0.63 0.10 3.40 0.35 271 1.00 0.85 0.84 0.18 3.70 20.6 0.21 0.75 0.15 2.70 0.81 1.65 0.83 TOF-ICP-MS 0.44 0.82 0.28 0.46 0.60 0.11 3.60 0.38 270 1.07 0.86 0.97 0.21 3.70 20.9 0.23 0.70 0.14 2.70 0.82 1.69 0.82 3.3.3 Použitý software Data byla vyhodnocena pomocí statistického programu ADSTAT 1.25 (TriloByte Statistical Software, s.r.o., ČR). 3.3.4 Řešení Vzhledem k tomu, že je výběr tvořen dvojicemi závislých měření, bylo pro testování shodnosti výsledků obou výběrů použito párového t-testu. Jak je zřejmé z výsledků uvedených v tabulce 3.3.2, je t statistika tabulkový kvantil t ( 1-α/2, Df1) a hypotéza H 0 : 2 0 je přijata. Rozdíly mezi hodnotami dosaženými pomocí vybraných metod nejsou na hladině významnosti 0.05 statisticky významné a výsledky metod lze považovat za shodné. 29

Tab. 3.3.2: Párový t-test shodnosti metod Hypotéza H 0 : 2 = 0 Průměrný rozdíl 6.82 10-3 Rozptyl 4.84 10-2 Počet stupňů volnosti Df1 21 Tabulkový kvantil t ( 1- α/2, Df1): 2.080 t-statistika 0.660 Závěr: H 0 přijata Průměry se považují za shodné Vypočtená hladina významnosti 0.516 3.3.5 Závěr Z párového t-testu vyplývá, že mezi výsledky dosaženými pomocí navržené TOF-ICP-MS a referenční HR-ICP-MS metody nejsou na hladině významnosti 0.05 statisticky významné rozdíly (p = 0.516). Navrženou metodu lze tedy považovat za přesnou a lze jí použít jako ekonomicky výhodnou a časově úspornou alternativu ke standardním ICP-MS postupům pro rutinní prvkovou analýzu kyseliny sírové. 3.3.6 Literatura 1. Meloun M., Militký J.: Kompendium statistického zpracování dat, Vyd. 3., nakl. Karolinum, Praha, 2012. ISBN: 978-80-246-2196-8. 2. Meloun M., Militký J.: Interaktivní statistická analýza dat, Vyd. 3., nakl. Karolinum, Praha, 2012. ISBN: 978-80-246-2173-9. 30