Uni- and multi-dimensional parametric tests for comparison of sample results

Podobné dokumenty
Karta předmětu prezenční studium

Protonační rovnováhy léčiv faktorovou analýzou a nelineární regresí absorbanční responzní plochy

UNIVERZITA PARDUBICE

Statistická analýza jednorozměrných dat

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Seminář 6 statistické testy

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Design Experimentu a Statistika - AGA46E

Analýza rozptylu ANOVA

Seminář 6 statistické testy

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

S E M E S T R Á L N Í

Stručný úvod do testování statistických hypotéz

S E M E S T R Á L N Í

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Statistická analýza. jednorozměrných dat

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

UNIVERZITA PARDUBICE

Porovnání dvou výběrů

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Plánování experimentu

ZNALOSTI A DOVEDNOSTI ČESKÝCH MUŽŮ V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Testy nezávislosti kardinálních veličin

ADDS cviceni. Pavlina Kuranova

ÚKOL ,77 5,00 5 2,531,003,056 -,869,113

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Tvorba nelineárních regresních

Tvorba nelineárních regresních modelů v analýze dat

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Testy statistických hypotéz

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Statistická analýza jednorozměrných dat

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření

Pomůcka pro cvičení: 3. semestr Bc studia

ZNALOSTI A DOVEDNOSTI ČESKÝCH ŽEN V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY

Intervalové Odhady Parametrů

Klasická a robustní ortogonální regrese mezi složkami kompozice

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

Statistické zpracování vodohospodářských dat

Statistická analýza jednorozměrných dat

Statistické testování hypotéz II

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

IDENTIFIKACE BIMODALITY V DATECH

Ranní úvahy o statistice

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

TECHNICKÁ UNIVERZITA V LIBERCI

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

MATEMATICKÁ STATISTIKA - XP01MST

Statistická analýza jednorozměrných dat

Vysoká škola ekonomická v Praze

6. Lineární regresní modely

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Kalibrace a limity její přesnosti

Odhalení skryté struktury a vnitřních vazeb dat vícerozměrnou statistickou analýzou pitné vody

LEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ

TEPELNÁ ZÁTĚŽ, TEPLOTNÍ REKORDY A SDĚLOVACÍ PROSTŘEDKY

Uloha B - Kvantitativní test. Radek Kubica A7B39TUR. B1 Radek Kubica Kvantitativní testování Stránka 1

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Normální (Gaussovo) rozdělení

Kapitola VII. ANALYSA ROZPTYLU ANOVA.

TEORIE A PRAXE INFORMAČNÍ BEZPEČNOSTI ČESKÝCH MANAŽERŮ STATISTICKÁ ANALÝZA

MSA-Analýza systému měření

Výuka odborného předmětu z elektrotechniky na SPŠ Strojní a Elektrotechnické

P-value. Alžběta Gardlo, Karel Hron Laboratoř metabolomiky Ústav molekulární a translační medicíny, UPOL a FNOL

PYTHAGORAS Statistické zpracování experimentálních dat

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Lubomír Pavliska. Datový sklad pro vědu a výzkum s návazností na datové analýzy klinických dat FNO

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Jste aktivní sportovec?(pravidelně sportuji alespoň 2x týdně) Jakým sportovním činnostem se pravidelně věnujete? (alespoň 1 x za dva týdny v sezóně)

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Transkript:

Uni- and multi-dimensional parametric tests for comparison of sample results Jedno- a více-rozměrné parametrické testy k porovnání výsledků Prof. RNDr. Milan Meloun, DrSc. Katedra analytické chemie, Universita Pardubice, 53210 Pardubice Email: milan.meloun@upce.cz Telefon: 466037026

Literatura M. Meloun, J. Militký: Kompendium statistického zpracování dat, Karolinum Praha 2012, 3. vydání, včetně DVD s databazí dat 1700, 985 stran. M. Meloun, J. Militký, M. Hil: Statistická analýza vícerozměrných dat v příkladech, Karolinum Praha 2017, 3. vydání, ISBN 978-80- 246-3618-4, včetně DVD s databazí dat řešených úloh, 757 stran.

Vyšetření předpokladů o výběru Examination of the sample assumptions Outliers Odlehlé body Symmetry Symetrie Heteroscedasticity Konstantní rozptyl Sample size Velikost výběru

Study case I Parametric tests for samples of uni-dimensional data Porovnání dvou vektorů dat

Test of the result accuracy

Evropa: porovnání t vůči kritické hodnotě t (1-α/2) (n-1)

USA: porovnání spočtené hladiny p vůči zadané hladině významnosti α

F1-test F2-test T3-test T1-test T2-test

F1-test F2-test Test of equal variances (homoscedasticity)

F1-test

F2-test

T1-test T2-test T3-test

T1-test

T2-test

T3-test

Normality test: Šikmost (skewness) < +-0.3

JB-test normality of the sample A Sample A: Normality is accepted JB-test normality of the sample B Sample B: Normality is accepted

F1 a F2-test of the homoskedasticity Conclusion: F1-test Sample variances are equal T1-test a T2-test of the means equality Conclusion: T1-test Sample means are not equal

Porovnání dvou výběrů QC-EXPERT Test shody průměrů Název úlohy : P332 pro SHODNÉ rozptyly Hladina významnosti : 0,050 t-statistika : 4,164 Porovnávané sloupce : P332a P332b Počet stupňů volnosti : 28,000 Počet dat : 15 15 Kritická hodnota : 2,048 Závěr : Průměry jsou ROZDÍLNÉ Průměr : 40,203 39,942 Pravděpodobnost : 0,000 Směr. odchylka : 0,142 0,197 Rozptyl : 0,020 0,039 Test shody průměrů pro ROZDÍLNÉ rozptyly Test shody rozptylů t-statistika : 4,164 Redukované stupně Poměr rozptylů : 1,932 volnosti : 25,000 Počet stupňů volnosti : 14 14 Kritická hodnota : 2,060 Kritická hodnota : 2,540 Závěr : Průměry jsou ROZDÍLNÉ Závěr : Rozptyly jsou SHODNÉ Pravděpodobnost : 0,000 Pravděpodobnost : 0,125 Test dobré shody rozdělení Robustní test shody rozptylů dvouvýběrový K-S test Poměr rozptylů : 1,932 Diference DF : 0,667 Redukované stupně volnosti : 7 7 Kritická hodnota : 0,496 Kritická hodnota : 3,787 Závěr : Rozdělení jsou ROZDÍLNÁ Závěr : Rozptyly jsou SHODNÉ Pravděpodobnost : 0,202

Normality test: Šikmost (skewness) is > 0.3.

JB-test normality of the sample A Sample A: JB-test Normality is rejected JB-test normality of the sample B Sample B: JB-test Normality is accepted

F1-test and F2-test of the homoscedasticity Conclusion: F2-test Sample variances are equal T3-test of the means equality Conclusion: T3-test Sample means are equal

Normality test: Šikmost (skewness) is > 0.3.

JB-test normality of the sample A Sample A: JB-test Normality is rejected JB-test normality of the sample B Sample B: JB-test Normality is accepted

F1-test and F2-test of the homoscedasticity Conclusion: F2-test Sample variances are equal T3-test of the means equality Conclusion: T3-test Sample means are not equal

Pair test for the pair data

Pair test for the pair data

Pair test Conclusion: Sample means are not equal

Horn

Horn s procedure for 4 n 20 Procedure based on order statistics. 1) Write the table of order statistics. 2) The pivot depth is expressed by H L = int[(n + l)/2]/2 or H L = int[(n + l)/2 + l]/2 according to which of the H L is an integer. 3) The lower pivot is x L = x (H) and the upper one is x U = x (n+1-h). 4) The estimate of the parameter of location is then expressed by the pivot half sum P 0.5( x x ) L L U

5) The estimate of the parameter of spread is expressed by the pivot range 6) The random variable R x x L U L P x x T L L U L R 2( x x ) L U L has approximately a symmetric distribution and its quantiles are given in Table. 7) The 95% confidence interval of the mean is expressed by pivot statistics as P R t ( n) P R t ( n) L L L,0.975 L L L,0.975

Exercise B3.01 Estimate of median value of haptoglobin in human blood serum (Horn) The concentration of haptoglobin in human blood serum was measured in eight adult individuals. Calculate estimates for median value, parameter of variance, and 95% interval of reliability of median value. Examine whether this sample comes from a logarithmic-normal distribution. Also apply Horn s procedure (pg. 51 in [14]). Data: Concentration of haptoglobin [g. l -1 ] in human blood serum: 1.82, 3.32, 1.07, 1.27, 0.49, 3.79, 0.15, 1.98.

Study case II Parametric tests for samples of multi-dimensional data Porovnání více vektorů ve zdrojové matici dat

Vícerozměrný test správnosti Výběr V1 je modrý, výběr V2 je červený. Úkol: Mají oba, a to výběr V 1 a výběr V 2 správnou střední hodnotu, tj. μ 1 = (1.75 70) a μ 2 = (1.75 70)? Vícerozměrný test shodnosti Úkol: Má výběr V 1 a výběr V 2 shodný vektor středních hodnot, tj. μ 1 = μ 2?

Vícerozměrný test správnosti Rozdíl mezi průměry výběrů je dle spočtené hladiny p > 0.05 nevýznamný.

Numerické řešení: Vícerozměrný test správnosti Vícerozměrný test správnosti výběru V1 Numerický test: Hotellingovou T 2 statistikou μ 0 = { 1,75 70} Rozdíl mezi průměry výběrů je dle spočtené hladiny p > 0.05 nevýznamný.

Vícerozměrný test správnosti výběru V1 Počítačový test: software NCSS2007 Rozdíl průměru po odečtení μ 0 Test rozdílu = μ - μ 0 vůči μ 0 = {1,75 70} Testování rozdílu vůči μ 0 Testování jednotlivých proměnných vůči μ 0 Rozdíl mezi průměry výběrů je dle spočtené hladiny p > 0.05 nevýznamný. Testování intervalu spolehlivosti rozdílů vůči μ 0

Vícerozměrný test správnosti výběru V2 Počítačový test: software NCSS2007 Rozdíl průměru po odečtení μ 0 Test rozdílu = μ - μ 0 vůči μ 0 = {1,75 70} Testování rozdílu vůči μ 0 Testování jednotlivých proměnných vůči μ 0 Rozdíl mezi průměry výběrů je dle spočtené hladiny p > 0.05 nevýznamný. Testování intervalu spolehlivosti rozdílu vůči μ 0

Vícerozměrný test shodnosti Výběr V1 je modrý, výběr V2 je červený. Úkol: Má výběr V 1 a výběr V 2 shodný vektor středních hodnot, tj. μ 1 = μ 2?

Vícerozměrný test shodnosti Rozdíl mezi průměry výběrů je dle spočtené hladiny p > 0.05 nevýznamný.

Vícerozměrný test shodnosti Vícerozměrný test shodnosti Numerický test: Hotellingovou T 2 statistikou Test: Rozdíl průměrů pro výběry V 1 a V 2 je roven μ 1 - μ 2, a pro spočtenou hladinu p > 0.05 je tento rozdíl nevýznamný

Rozdíl mezi průměry výběrů je dle spočtené hladiny p > 0.05 nevýznamný. Rozdíl mezi průměry výběrů je dle spočtené hladiny p > 0.05 nevýznamný.

Vícerozměrný test shodnosti Počítačový test: softwarem NCSS2007 Rozdíl mezi průměry výběrů je roven = μ 1 μ 2 Rozdíl dvou průměrů by měl být nula se svou směrodatnou odchylkou Rozdíl dvou průměrů u ostatních proměnných kromě průměru vlevo; Změna rozdílu. kromě toho vlevo; Změna rozdílu. od toho vlevo; Rozdíl mezi průměry výběrů je dle spočtené hladiny p > 0.05 nevýznamný. Testování rozdílu dvou průměru jeho intervalem spolehlivosti

Vícerozměrný test shodnosti pro více středních hodnot

Vícerozměrný test shodnosti pro více středních hodnot

Rozdíl průměrů tří výběrů je dle spočtené hladiny p < 0.05 významný.

Vícerozměrný test shodnosti pro 3 střední hodnoty Počítačové řešení: software NCSS2007 Test: Rozdíl průměrů tří výběrů je dle spočtené hladiny p < 0.05 významný.

M. Meloun, J. Militký: Interaktivní statistická analýza dat, Karolinum Praha 2012, 4. vydání, včetně DVD s databazí dat 1700, 955 stran M. Meloun, J. Militký: Kompendium statistického zpracování dat, Karolinum Praha 2012, 3. vydání, včetně DVD s databazí dat 1700, 985 stran. M. Meloun, J. Militký, M. Hil: Statistická analýza vícerozměrných dat v příkladech, Karolinum Praha 2017, 3. vydání, ISBN 978-80-246-3618-4, včetně DVD s databazí dat řešených úloh, 757 stran. M. Meloun, J. Militký: Statistical Data Analysis, A Practical Guide with 1250 Exercises and Answer key on CD, Woodhead Publishing India, 2011, 1600 pages, ISBN: 978-93-80308-11-1 M. Meloun, J. Militký, M. Forina: CHEMOMETRICS FOR ANALYTICAL CHEMISTRY: Volume 1: PC-Aided Statistical Data Analysis, Ellis Horwood, Chichester 1992, 330 stran, ISBN 0-13-126376-5 M. Meloun, J. Militký, M. Forina: CHEMOMETRICS FOR ANALYTICAL CHEMISTRY. Volume 2: PC-Aided Regression and Related Methods, Ellis Horwood, Chichester 1994, ISBN 0-13-123788-7

Děkuji za pozornost! http://meloun.upce.cz