Statistické zpracování dat:

Podobné dokumenty
= = 2368

Protokol č. 1. Tloušťková struktura. Zadání:

Úvod do analýzy rozptylu

UKAZATELÉ VARIABILITY

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

4ST201 STATISTIKA CVIČENÍ Č. 7

Neparametrické metody

Jednofaktorová analýza rozptylu

MUDr. Bohumil Havel KHS Pardubického kraje

Cvičení ze statistiky - 9. Filip Děchtěrenko

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Kontaminace půdy pražské aglomerace

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Stanovení hloubky karbonatace v čase t

Testování statistických hypotéz

STATISTICKÉ TESTY VÝZNAMNOSTI

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Stručný úvod do testování statistických hypotéz

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

STATISTICKÉ ODHADY Odhady populačních charakteristik

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

VALIDACE GEOCHEMICKÝCH MODELŮ POROVNÁNÍM VÝSLEDKŮ TEORETICKÝCH VÝPOČTŮ S VÝSLEDKY MINERALOGICKÝCH A CHEMICKÝCH ZKOUŠEK.

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

TLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ

STATISTICKÉ TESTY VÝZNAMNOSTI

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Vzorová prezentace do předmětu Statistika

Využití rozptylových studií pro hodnocení zdravotních rizik. MUDr.Helena Kazmarová Státní zdravotní ústav Praha

Regresní a korelační analýza

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

You created this PDF from an application that is not licensed to print to novapdf printer (

Maximání tepová rezerva - MTR

KGG/STG Statistika pro geografy

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Číselné charakteristiky

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Regresní a korelační analýza

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Využití metody pasivního vzorkování. -pro stanovení toxicity a genotoxicity vzorků volného ovzduší

Číselné charakteristiky a jejich výpočet

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY

STATISTICKÉ CHARAKTERISTIKY

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Testy statistických hypotéz

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Popisná statistika kvantitativní veličiny

Normální (Gaussovo) rozdělení

Metodologie pro Informační studia a knihovnictví 2

Porovnání dvou výběrů

Statistická analýza jednorozměrných dat

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Ranní úvahy o statistice

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Analýza dat na PC I.

Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy.

Metodologie pro Informační studia a knihovnictví 2

VYSOKONAPĚŤOVÉ ZKUŠEBNICTVÍ. #2 Nejistoty měření

Testování hypotéz. 4. přednáška

Vyjadřování přesnosti v metrologii

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Normální (Gaussovo) rozdělení

Statistika pro geografy

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Řízení projektů. Konstrukce síťového grafu pro řízení projektů Metoda CPM Metoda PERT

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Zjišťování toxicity látek

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Statistika (KMI/PSTAT)

Jednofaktorová analýza rozptylu

Postup pro kalibraci vyměřené zkušební dráhy pro stanovení konstanty vozidla W a účinného obvodu pneumatik (dále jen dráhy )

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Bezpečnost potravin ve vztahu k reziduím léčiv. nové aspekty hodnocení bezpečnosti farmakologicky účinných látek

Resolution, Accuracy, Precision, Trueness

Náhodné veličiny, náhodné chyby

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Matematická statistika Zimní semestr

Základní statistické charakteristiky

Regulační diagramy (RD)

Příloha č. 1. amplitudová charakteristika filtru fázová charakteristika filtru / frekvence / Hz. 1. Určení proudové hustoty

TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta

Klasifikace směsí. Ing. Hana Krejsová. Tel.:

PRAVDĚPODOBNOST A STATISTIKA

Statistika - charakteristiky variability

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Transkript:

Statistické zpracování dat: Chceme-li zjistit, jestli se liší dvě skupiny dat (třeba jestli je jedna lokalita více znečištěná než druhá), můžeme použit tzv. Studentův t-test. Tento test (v téhle variantě se jedná o nepárový dvouvýběrový) porovnává průměrné hodnoty obou skupin, přičemž zohledňuje variabilitu vevnitř skupiny. Výsledkem testu je pak testové statistiky t. Tuto hodnotu můžeme porovnat s tabelovanou kritickou hodnotou. Je-li t nižší nebo stejná jako, rozdíl mezi testovanými průměry je statisticky nevýznamný. Pokud je ale t vyšší, porovnávané skupiny můžeme považovat za odlišné. Pozor! Správná závisí kromě jiného od počtu tzv. stupňů volnosti. Tyto přímo souvisí s velikostí porovnávaných skupin. Statistika je proto tím přesnější, čím více dat máme k dispozici. Vzorec na výpočet testové statistiky t, kde x 1 a x 2 jsou aritmetické průměry jednotlivých skupin, s 1 a s 2 jsou směrodatné odchylky výběru a n je počet členů jedné skupiny. t = x 1 x 2 s 2 1 +s2 2 n Počet stupňů volnosti (SV ) v tomto případě vypočítáme jako: SV = 2 n 2 Průměr a směrodatnou odchylku lze počítat ručně, jednodušší je ale použít funkce tabulkového programu, např. Excel. Pozn.: Pro použití t-testu v téhle formě je nutné, aby data splňovala několik kritérií musí pocházet z normálního rozložení, skupiny musí mít stejné rozptyly a stejný počet členů. Pro účel zadání úlohy považujeme všechny tyto podmínky za splněné. Hodnocení rizik V případě dlouhodobé (chronické) expozice můžeme mluvit o chronickém denním příjmu (chronic daily intake, CDI). Tento příjem je pak porovnán s referenční dávkou (Rf D) vypočtenou z hodnoty nejvyšší dávky, která ještě nezpůsobuje poškození (NOAEL), nebo z nejnižší dávky, která už poškození způsobuje (LOAEL). Hodnoty N OAEL a LOAEL jsou obvykle získány ze studií na zvířecích modelech a/nebo epidemiologických studií. Do výpočtu vstupuje i bezpečnostní faktor (SF ), který pokrývá nejistotu stanovení a závisí na typu výchozích dat a dosahuje obvykle hodnoty od 10 do 10000. Porovnáním denního příjmu s referenční dávkou získáme index nebezpečnosti (HI). Je-li vyšší jako jedna (příjem překračuje referenční dávku), hrozí reálné riziko poškození lidského zdraví. Rovnice pro výpočet CDI: CDI = HI = CDI RfD CA IR ET EF ED BW AT CDI chronický denní příjem (ng kg 1 den 1 ) CA koncentrace ve vzduchu (ng m 3 ) IR inhalované množství (m 3 den 1 ) ET doba expozice (hod den 1 ) 1

EF frekvence expozice (den rok 1 ) ED trvání expozice (rok) BW tělesná váha (kg) AT konstanta pro účel konzistence jednotek (ED 365 den rok 1 ) Pro výpočet Rf D používáme rovnici obsahující bezpečnostní faktor. Ten spočítáme součinem dílčích bezpečnostních faktorů, které charakterizují vstupní data. Základní dílčí hodnoty jsou: 10 pro pokrytí různorodosti mezi lidmi 10 pokud byly vstupní hodnoty N OAEL zjištěny na zvířatech místo lidí 10 v případě, že N OAEL byl zjištěn akutní expozicí a počítáme chronickou 10 v případě, že je místo NOAEL použita LOAEL RfD = NOAEL SF RfD referenční dávka (ng kg 1 den 1 ) NOAEL nejvyšší dávka, při které ještě není pozorován škodlivý účinek (ng kg 1 den 1 ) SF součin bezpečnostních faktorů Tabulka 1: Koncentrace PFOS v krevní plazmě (ng/ml) některých skupin obyvatelstva. Číslo Hasičský Servis Personál Personál Dopravci Obsluha Místní vzorku sbor lyží prádelny hotelu vleků obyvatelé (kontrola) 1 32,82 16,73 17,12 3,48 5,30 12,57 7,82 2 51,13 6,94 5,27 8,98 17,59 2,93 0,62 3 24,19 30,12 0,98 11,10 12,48 3,40 16,96 4 19,80 32,54 7,11 6,34 12,40 37,22 7,82 5 8,89 12,96 17,27 7,91 1,25 38,20 4,50 6 47,06 35,26 3,45 17,36 1,20 20,96 1,41 7 21,06 7,71 19,64 5,16 18,60 1,29 7,63 8 28,94 30,98 8,72 10,36 12,60 13,84 2,52 9 6,60 15,07 9,45 3,97 9,56 23,08 6,19 10 17,05 27,65 3,42 8,33 10,51 20,39 18,56 11 47,76 15,05 12,51 11,23 5,27 33,40 3,89 12 21,24 15,75 19,87 18,47 1,42 19,78 8,69 13 44,98 12,43 7,69 7,30 3,74 21,34 1,98 14 57,42 31,62 9,97 0,42 7,60 14,23 0,18 15 56,07 12,32 13,80 4,32 14,49 2,72 2,16 2

Tabulka 2: Kritické hodnoty testové statistiky podle počtu stupňů volnosti (SV). SV 1 2 3 4 5 6 7 8 9 10 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 SV 12 14 16 18 20 22 24 26 28 30 2,179 2,145 2,120 2,101 2,086 2,074 2,064 2,056 2,048 2,042 SV 35 40 45 50 60 70 80 90 100 2,030 2,021 2,014 2,009 2,000 1,994 1,990 1,987 1,984 Tabulka 3: Koncentrace PFOS (pg/vzorek) ve vzorcích prachu a stěrů. číslo vzorku c P F OS (ng/vzorek) 1 12,4 2 32,3 3 60,2 4 75,4 5 84,2 6 292 7 254 8 191 9 79,4 10 94,2 11 568 12 325 3

Tabulka 4: Charakteristika odběrových lokalit. číslo plocha množství vzorku odběrového popis odběrového místa přesítovaného místa (m 2 ) vzorku (g) 1 1 podlaha u vstupu do předsíně prádelny 0,205 2 1 podlaha před vstupem do prádelny 0,168 3 3 podlaha u předpíracích umyvadel 0,302 4 3 podlaha u sušiček I. 1,012 5 3 podlaha u sušiček II. 0,706 6 3 podlaha u praček 0,152 7 1 povrch sušičky I. 8 1 povrch sušičky II. 9 1 povrch pračky I. 10 1 povrch pračky II. 11 3 podlaha u vstupu do technické místnosti 0,230 12 3 podlaha u velkokapacitní nádrže na odpadní vodu 0,606 Tabulka 5: Průměrné hodnoty charakterizující exponované pracovníky. Vdechnutý vzduch 0,83 m 3 /hod Doba expozice 8 hod/den Frekvence expozice 250 den/rok Trvání expozice 25 rok Průměrná váha 70 kg 4

Nákres vzorkovacího plánu 5