Statistická analýza jednorozměrných dat

Podobné dokumenty
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Tvorba nelineárních regresních modelů v analýze dat

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Statistická analýza. jednorozměrných dat

UNIVERZITA PARDUBICE

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

S E M E S T R Á L N Í

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Statistická analýza jednorozměrných dat

S E M E S T R Á L N Í

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Kvantily a písmenové hodnoty E E E E-02

Statistická analýza jednorozměrných dat

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Statistická analýza jednorozměrných dat

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Porovnání dvou reaktorů

UNIVERZITA PARDUBICE

Analýza rozptylu ANOVA

Statistická analýza jednorozměrných dat

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

UNIVERZITA PARDUBICE

Porovnání dvou výběrů

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Kalibrace a limity její přesnosti

Modul Základní statistika

Uni- and multi-dimensional parametric tests for comparison of sample results

Kalibrace a limity její přesnosti

Charakteristika datového souboru

Tvorba nelineárních regresních

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Zápočtová práce STATISTIKA I

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

Exploratorní analýza dat

Průzkumová analýza dat

PYTHAGORAS Statistické zpracování experimentálních dat

Nejlepší odhady polohy a rozptýlení chemických dat

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti

Kalibrace a limity její přesnosti

LICENČNÍ STUDIUM GALILEO SEMESTRÁLNÍ PRÁCE

, Brno Hanuš Vavrčík Základy statistiky ve vědě

TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Plánování experimentu

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Příloha č. 1 Grafy a protokoly výstupy z adstatu

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Stručný úvod do testování statistických hypotéz

Inovace bakalářského studijního oboru Aplikovaná chemie

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

IDENTIFIKACE BIMODALITY V DATECH

FAKULTA CHEMICKO-TECHNOLOGICKÁ KATEDRA ANALYTICKÉ CHEMIE. Semestrální práce z CHEMOMETRE. TOMÁŠ SYROVÝ 4.ročník

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

VŠB Technická univerzita Ostrava BIOSTATISTIKA

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Minimální hodnota. Tabulka 11

TVORBA GRAFŮ A DIAGRAMŮ V ORIGIN. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

UNIVERZITA PARDUBICE

PRŮZKUMOVÁ ANALÝZA DAT (EDA)

Testy statistických hypotéz

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

Úloha 1: Lineární kalibrace

Návrh a vyhodnocení experimentu

STATISTICKÉ CHARAKTERISTIKY

2.2 Kalibrace a limity její p esnosti

Statistické zpracování výsledků

6. Lineární regresní modely

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Tvorba nelineárních regresních modelů v analýze dat

KALIBRACE A LIMITY JEJÍ PŘESNOSTI 2015

UNIVERZITA PARDUBICE

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba nelineárních regresních modelů v analýze dat. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Pravděpodobnost a matematická statistika

Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Transkript:

Univerzita Pardubice Fakulta chemicko-technologická, Katedra analytické chemie Licenční studium GALILEO Interaktivní statistická analýza dat Semestrální práce z předmětu Statistická analýza jednorozměrných dat Vypracoval Ing. Ladislav Menšík, Ph.D. Ústav ekologie lesa Mendelova univerzita v Brně Lesnická a dřevařská fakulta Brno srpen, 2015 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 1

Obsah Úvod...3 1. Statistická analýza velkých výběrů...4 2. Statistická analýza malých výběrů dle Horna... 11 3. Statistické testování... 16 Použitá literatura... 20 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 2

Úvod Při lesnickém výzkumu dochází k pořizování různých typů výzkumných dat s velkými výběry (n > 30) i data velmi malých výběrů (n > 10; n > 4). Pro hodnocení musí být použity různé korektní postupy a metody statistické analýzy dat včetně různých typů software. Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 3

1. Statistická analýza velkých výběrů Zadání V rámci řešení projektu COST LD14018 - Udržitelné hospodaření smíšených lesů vrchovin Toky látek a biogeochemické koloběhy živin v roce 2014 byla změřena výčetní tloušťka (d 1,3 ) všech stromů ve smíšeném porostu modřínu s bukem ve věku cca 33 let v oblasti Drahanské vrchoviny. Cílem úlohy je na větším výběru dat (n > 30) aplikovat obecný postup analýzy jednorozměrného výběru. Data - výčetní tloušťky (d 1,3 ) stromů dřeviny modřín (MD) v cm Tab. 1: Vstupní data - výčetní tloušťky (d 1,3 ) stromů dřeviny modřín (MD) v cm, n = 100 34.00 29.25 27.60 20.25 32.15 18.10 31.70 20.05 20.25 17.20 29.75 36.15 28.75 30.25 32.00 30.65 24.00 20.35 25.20 24.65 27.95 31.00 22.00 30.00 32.40 28.75 21.75 30.05 26.75 25.70 30.50 19.75 32.20 35.15 26.25 20.60 28.90 15.15 27.00 24.50 18.10 34.20 29.65 6.50 16.60 13.65 14.55 20.90 20.85 24.10 21.75 26.85 22.35 26.05 24.95 16.85 20.10 26.30 26.00 25.35 29.60 31.25 12.75 22.70 14.15 20.60 25.75 23.95 23.70 28.40 27.95 27.40 18.55 28.50 26.80 21.90 27.30 28.25 15.40 35.25 23.65 31.00 36.75 15.00 22.20 38.40 26.05 27.85 23.50 20.25 33.45 24.40 26.60 29.75 31.30 26.30 28.10 25.90 21.00 27.50 Užitý program - ADSTAT - QC Expert - Průzkumová analýza dat (EDA) - průzkum statistických zvláštností dat symetrie, špičatost, lokální koncentrace, přítomnost odlehlých bodů. Obrázky Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 4

Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 5

Četnost 30 Histogram - Sheet1 - A Kvantil-Data 40 Q-Q Graf - Sheet1 - A 20 30 20 10 10 A 0 0 10 20 30 40 0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 Kvantil-Norm Diagramy rozptýlení - Sheet1 - A Hustota 0.070 0.060 0.050 0.040 0.030 0.020 Odhad hustoty - Sheet1 - A 0 10 20 30 40 A 0.010 A 0.000-10 0 10 20 30 40 50 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 6

Krabicový graf - Sheet1 - A r 0.30 0.20 0.10 0.00-0.10-0.20 Autokorelace - Sheet1 - A 0 10 20 30 40 A -0.30 Řád 1.0 2.0 3.0 4.0 A 40 Trendy vyhlazení - Sheet1 - A A 40 Kvantilový graf - Sheet1 - A 30 20 Data Průměr Medián 30 20 10 10 i 0 0 10 20 30 40 50 60 70 80 90 100 P 0 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 P-P Graf - Sheet1 - A Normal Uniform Laplace p-data 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 p-teor 0.00 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 A Graf rozptýlení s kv antily - Sheet1 - A 40 30 20 10 P 0 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 Poloha 27.0 Graf polosum - Sheet1 - A Poloha 27.0 Graf symetrie - Sheet1 - A 26.0 26.0 25.0 25.0 24.0 24.0 23.0 23.0 A 22.0 0 10 20 30 40 22.0 x 0.0 1.0 2.0 3.0 y 2.6 2.4 2.2 2.0 1.8 1.6 1.4 Graf špičatosti - Sheet1 - A 1.2 1.0 0.8 x 0.0 1.0 2.0 3.0 Kruhový Graf - Sheet1 - A y 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 x 0.00-0.50-0.40-0.30-0.20-0.10 0.00 0.10 0.20 0.30 0.40 0.50 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 7

Output 1) Klasické odhady parametrů: Parametr ADSTAT QC Expert Průměr 25,33 25,33 Medián 26,05 26,05 Šikmost -0,39-0,39 Špičatost 3,11 3,11 Směrodatná odchylka 5,93 5,93 2) Test normality: Tabulkový kvantil Chi^2(1-alfa,2): 5.9915E+00 Chi^2-statistika: 2.9596E+00 Závěr: Předpoklad normality přijat Vypočtená hladina významnosti: 2.2768E-01 3) Test nezávislosti: Tabulkový kvantil t(1-alfa/2,n+1): 1.9837E+00 Test autokorelace: 6.3907E-01 Závěr: Předpoklad nezávislosti přijat Vypočtená hladina významnosti: 2.6211E-01 Předpoklad homogenity výběru: Aritmetický průměr: 2.5334E+01 Rozptyl: 3.5184E+01 Směrodatná odchylka: 5.9316E+00 Vnitřní meze: Spodní mez: 1.7435E+00 Horní mez: 4.8831E+01 4) Minimální velikost vývěru: pro 25% relativní chybu směrodatné odchylky: n = 9 pro 10% relativní chybu směrodatné odchylky: n = 54 pro 5% relativní chybu směrodatné odchylky: n = 212 5) Detekce odlehlých bodů: Ve výběru nejsou odlehlé body. 6) Porovnání rozdělení: LINEARITA V GRAFU KVANTIL-KVANTIL (Q-Q): Rozdělení Směrnice Úsek Korelační koeficient 0 Laplaceovo 4.2640E+00 2.5334E+01 9.8109E-01 1 Normální 5.9569E+00 2.5334E+01 9.9291E-01 2 Exponenciální 5.3326E+00 2.0049E+01 8.6992E-01 3 Rovnoměrné 1.9919E+01 1.5375E+01 9.7180E-01 4 Lognormální 2.5020E+00 2.1315E+01 7.7751E-01 5 Gumbelovo 4.6773E+00 2.8001E+01 9.8862E-01 6Weibullovo( 0.5) 1.0503E+00 2.3329E+01 6.6803E-01 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 8

6Weibullovo( 1.0) 5.3326E+00 2.0049E+01 8.6992E-01 6Weibullovo( 1.5) 9.2089E+00 1.7050E+01 9.3786E-01 6Weibullovo( 2.0) 1.2490E+01 1.4285E+01 9.6651E-01 6Weibullovo( 2.5) 1.5431E+01 1.1656E+01 9.8043E-01 6Weibullovo( 3.0) 1.8177E+01 9.1101E+00 9.8782E-01 6Weibullovo( 3.5) 2.0806E+01 6.6173E+00 9.9195E-01 6Weibullovo( 4.0) 2.3361E+01 4.1600E+00 9.9435E-01 6Weibullovo( 4.5) 2.5865E+01 1.7275E+00 9.9574E-01 6Weibullovo( 5.0) 2.8335E+01-6.8712E-01 9.9655E-01 6Weibullovo( 5.5) 3.0780E+01-3.0884E+00 9.9699E-01 6Weibullovo( 6.0) 3.3205E+01-5.4796E+00 9.9720E-01 6Weibullovo( 6.5) 3.5617E+01-7.8629E+00 9.9726E-01 6Weibullovo( 7.0) 3.8017E+01-1.0240E+01 9.9723E-01 6Weibullovo( 7.5) 4.0409E+01-1.2612E+01 9.9713E-01 6Weibullovo( 8.0) 4.2793E+01-1.4980E+01 9.9700E-01 7 Logistické 3.3201E+00 2.5334E+01 9.9154E-01 8 Cauchyho 5.0368E-01 2.5334E+01 7.0513E-01 7) Transformace dat: PROSTÁ MOCNINNÁ TRANSFORMACE: Optimální mocnina: 1.6000E+00 pro šikmost: 2.3271E-02 Optimální mocnina: 2.0000E+00 pro asymetrii: 1.3678E-03 Optimální mocnina: 3.0667E+00 pro asymetrii, rob.: 3.9361E-03 Optimální mocnina:-3.7333e+00 pro Hinkley-asymetrii: 8.8949E-06 Zvolená mocnina: 1.60 Průměr: 1.8086E+02 Rozptyl: 4.0953E+03 Směrodatná odchylka: 6.3995E+01 Šikmost: 2.3271E-02 Špičatost: 2.7182E+00 Opravený průměr: 2.5754E+01 BOX-COXOVA TRANSFORMACE: Optimální mocnina: 1.6000E+00 pro šikmost: 2.3271E-02 Optimální mocnina: 2.4000E+00 pro špičatost: 3.0154E+00 Optimální mocnina: 2.0000E+00 pro asymetrii: 1.3678E-03 Optimální mocnina: 3.0667E+00 pro asymetrii, rob.: 3.9361E-03 Optimální mocnina:-3.4667e+00 pro Hinkley-asymetrii: 2.2237E-06 Optimální mocnina: 1.4667E+00 pro věrohodnost:-1.7685e+02 Zvolená mocnina: 1.60 Průměr: 1.1241E+02 Rozptyl: 1.5997E+03 Směrodatná odchylka: 3.9997E+01 Šikmost: 2.3271E-02 Špičatost: 2.7182E+00 Opravený průměr: 2.5754E+01 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 9

Závěr Z diagnostických grafů vyplynulo, že rozdělení dat je blízké normálnímu, což bylo prokázáno například analýzou špičatosti. Průzkumová analýza dat dále potvrdila homogenitu dat a byl přijat předpoklad normality dat, dále test nezávislosti prokázal, že data jsou nezávislá. Klasické odhady parametrů programy ADSTAT i QC Expert přinesly shodné údaje. Test odlehlých bodů programem ADSTAT i QC Expert ne našel odlehlý bod, ale na krabicových grafech jsou zobrazeny. Rozdíl mezi průměrem a mediánem není významný, což ukazuje na normální rozdělení. Stanovená hypotéza, že transformace dat byla nutná, se zamítá, a to pomocí dvou metod transformace - prostá mocninná, Box- Coxova. Jelikož výsledkem každé transformace byla jiná hodnota průměru. Doporučením je uvádět aritmetický průměr, který se výrazně neliší od mediánu, ani od opravených průměrů vypočtených transformací. Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 10

2. Statistická analýza malých výběrů dle Horna Zadání V oblasti Drahanské vrchoviny jsou měřeny a hodnoceny koncentrace (mg.l -1 ) rozpustného organického uhlíku (DOC) v průsakových vodách pod nadložním humusem ve smrkovém porostu. Cílem úlohy 2 je pomocí Hornovy metody pivotů určit parametry polohy a rozptýlení. Výsledky budou porovnány s klasickými a robustními odhady polohy a rozptýlení pomocí zvoleného software. Pro zpracování dat bude využito programu ADSTAT a QC Expert.. Data - koncentrace DOC (mg.l -1 ) v průsakových vodách pod nadložním humusem v letech 2006-2013 Tab. 1: Vstupní data - koncentrace DOC (mg.l -1 ) v průsakových vodách pod nadložním humusem v letech 2006-2013, n = 8, sudé 2006 2007 2008 2009 2010 2011 2012 2013 59.5 49.5 55.2 58.9 41.2 45.3 43.8 39.9 Užitý program - MS Excel Řešení 1) Uspořádání dat vzestupně i 1 2 3 4 5 6 7 8 x(i) 39.9 41.2 43.8 45.3 49.5 55.2 58.9 59.5 2) Hloubka pivotu H = (int ((n + 1) / 2)) / 2 H = (int ((8 + 1) / 2)) / 2 = 2,25 --- 2 3) Pivoty Dolní pivot: = = (3) = 41,2 Horní pivot: = ( +1 ) =58,9 4) Pivotová polosuma PL = ( + ) / 2 = 50,05 5) Pivotové rozpětí RL = = 17,7 6) 95% interval spolehlivosti střední hodnoty μ K výpočtu byla použita tabulka kvantilů dle Meloun, Militký (2012) str. 154:,1 2( ) = 0,564.,1 2( ) μ +,1 2( ) Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 11

50,05 17,7 0,564 μ 50,05 + 17,7 0,564 40,0672 μ 60,0328 7) Ověření vypočtených hodnot programem QC Expert Střední hodnota: 50,05 Spodní mez (2,5 %): 40,0672 Horní mez (97,5 %): 60,0328 Pivotové rozpětí: 17,7 Závěr Bodový odhad polohy v případě odhadu míry polohy obsahu DOC v průsakových vodách pod nadložním humusem ve smrkovém porostu je 50,05 mg.l -1. Míra rozptýlení je 17,7 mg.l -1. Lze konstatovat, že s 95% statistickou jistotou leží obsah DOC v průsakových vodách pod nadložním humusem ve smrkovém porostu v intervalu 40,1 až 60,0 mg.l -1. Porovnání s klasickými a robustními odhady polohy a rozptýlení Užitý program - ADSTAT - QC Expert Output Základní předpoklady (1) KLASICKÉ ODHADY PARAMETRŮ Medián: 4.7400E+01 Průměr: 4.9163E+01 Rozptyl: 6.1588E+01 Šikmost: 2.3281E-01 Špičatost: 1.4707E+00 Směrodatná odchylka: 7.8478E+00 (2) TEST NORMALITY: Tabulkový kvantil Chi^2(1-alfa,2): 5.9915E+00 Chi^2-statistika: 1.6454E+00 Závěr: Předpoklad normality přijat Vypočten hladina významnosti: 4.3925E-01 (3) TEST NEZÁVISLOSTI: Tabulkový kvantil t(1-alfa/2,n+1) : 2.2622E+00 Test autokorelace : 1.5419E+00 Závěr: Předpoklad nezávislosti přijat Vypočtená hladina významnosti: 7.8748E-02 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 12

Předpoklad homogenity výběru: Aritmetický průměr: 4.9163E+01 Rozptyl: 6.1588E+01 Směrodatná odchylka: 7.8478E+00 Vnitřní meze: Spodní mez: 1.6310E+01 Horní mez: 8.3240E+01 (4) MINIMÁLNÍ VELIKOST VÝBĚRU: pro 25% relativní chybu směrodatné odchylky: n = 3 pro 10% relativní chybu směrodatné odchylky: n = 13 pro 5% relativní chybu směrodatné odchylky: n = 48 (5) DETEKCE ODLEHLÝCH BODŮ: Ve výběru nejsou odlehlé body (6) POROVNÁNÍ ROZDĚLENÍ: Rozdělení Směrnice Úsek Korelační koeficient 0 Laplaceovo 6.3627E+00 4.9163E+01 9.3449E-01 1 Normální 8.1454E+00 4.9163E+01 9.6526E-01 2 Exponenci lní 8.7308E+00 4.1051E+01 9.3230E-01 3 Rovnoměrné 2.5938E+01 3.6193E+01 9.8133E-01 4 Lognormální 5.4064E+00 4.1428E+01 8.9547E-01 5 Gumbelovo 6.4807E+00 5.2558E+01 9.3496E-01 6Weibullovo( 0.5) 2.7714E+00 4.5068E+01 8.0237E-01 6Weibullovo( 1.0) 8.7308E+00 4.1051E+01 9.3230E-01 6Weibullovo( 1.5) 1.3437E+01 3.7397E+01 9.6212E-01 6Weibullovo( 2.0) 1.7431E+01 3.3939E+01 9.6847E-01 6Weibullovo( 2.5) 2.1102E+01 3.0573E+01 9.6853E-01 6Weibullovo( 3.0) 2.4612E+01 2.7253E+01 9.6679E-01 6Weibullovo( 3.5) 2.8034E+01 2.3958E+01 9.6464E-01 6Weibullovo( 4.0) 3.1403E+01 2.0679E+01 9.6250E-01 6Weibullovo( 4.5) 3.4739E+01 1.7410E+01 9.6053E-01 6Weibullovo( 5.0) 3.8053E+01 1.4148E+01 9.5876E-01 6Weibullovo( 5.5) 4.1351E+01 1.0890E+01 9.5718E-01 6Weibullovo( 6.0) 4.4638E+01 7.6349E+00 9.5577E-01 6Weibullovo( 6.5) 4.7917E+01 4.3828E+00 9.5451E-01 6Weibullovo( 7.0) 5.1189E+01 1.1327E+00 9.5339E-01 6Weibullovo( 7.5) 5.4457E+01-2.1160E+00 9.5238E-01 6Weibullovo( 8.0) 5.7720E+01-5.3635E+00 9.5148E-01 7 Logistick 4.7121E+00 4.9163E+01 9.5598E-01 8 Cauchyho 2.9305E+00 4.9163E+01 8.7946E-01 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 13

9 Paretovo( 0.5) 8.2849E-02 4.6852E+01 6.3019E-01 9 Paretovo( 1.0) 1.4735E+00 4.3771E+01 7.6437E-01 9 Paretovo( 1.5) 4.2772E+00 3.9866E+01 8.2413E-01 9 Paretovo( 2.0) 7.7594E+00 3.5709E+01 8.5417E-01 9 Paretovo( 2.5) 1.1570E+01 3.1457E+01 8.7165E-01 9 Paretovo( 3.0) 1.5558E+01 2.7160E+01 8.8292E-01 9 Paretovo( 3.5) 1.9651E+01 2.2841E+01 8.9075E-01 9 Paretovo( 4.0) 2.3811E+01 1.8508E+01 8.9647E-01 9 Paretovo( 4.5) 2.8016E+01 1.4166E+01 9.0083E-01 9 Paretovo( 5.0) 3.2253E+01 9.8193E+00 9.0426E-01 9 Paretovo( 5.5) 3.6514E+01 5.4685E+00 9.0702E-01 9 Paretovo( 6.0) 4.0791E+01 1.1148E+00 9.0929E-01 9 Paretovo( 6.5) 4.5083E+01-3.2410E+00 9.1119E-01 9 Paretovo( 7.0) 4.9384E+01-7.5983E+00 9.1280E-01 9 Paretovo( 7.5) 5.3695E+01-1.1957E+01 9.1419E-01 9 Paretovo( 8.0) 5.8012E+01-1.6316E+01 9.1539E-01 10 Gamma( 0.5) 1.3457E+01 4.3357E+01 8.9460E-01 10 Gamma( 1.0) 8.9032E+00 4.0913E+01 9.3773E-01 10 Gamma( 1.5) 7.0900E+00 3.9064E+01 9.5080E-01 10 Gamma( 2.0) 6.0589E+00 3.7511E+01 9.5679E-01 10 Gamma( 2.5) 5.3743E+00 3.6144E+01 9.6013E-01 10 Gamma( 3.0) 4.8779E+00 3.4910E+01 9.6220E-01 10 Gamma( 3.5) 4.4971E+00 3.3776E+01 9.6359E-01 10 Gamma( 4.0) 4.1931E+00 3.2721E+01 9.6457E-01 10 Gamma( 4.5) 3.9432E+00 3.1730E+01 9.6529E-01 10 Gamma( 5.0) 3.7330E+00 3.0793E+01 9.6583E-01 10 Gamma( 5.5) 3.5531E+00 2.9903E+01 9.6624E-01 10 Gamma( 6.0) 3.3969E+00 2.9052E+01 9.6657E-01 10 Gamma( 6.5) 3.2595E+00 2.8235E+01 9.6683E-01 10 Gamma( 7.0) 3.1375E+00 2.7450E+01 9.6704E-01 10 Gamma( 7.5) 3.0282E+00 2.6693E+01 9.6721E-01 10 Gamma( 8.0) 2.9296E+00 2.5960E+01 9.6735E-01 (7) ROBUSTNÍ ODHADY PARAMETRŮ: Medián: 4.7400E+01 Směrodatná odchylka mediánu: 1.2728E+01 Rozptyl mediánu: 1.6201E+02 95.0% spolehlivost: Spodní mez: 3.5520E+01 Horní mez: 5.9280E+01 Závěr Výsledky byly porovnány s klasickými a robustními odhady polohy a rozptýlení pomocí zvoleného software ADSTAT. Z výsledků ověření dat vyplývá, že data vykazují rozdělení normální (rovnoměrné). Ve výběru nejsou odlehlé body. Z tabulky vyplývá, že všechny metody uvádí obdobné hodnoty. Celkově bližší jsou si hodnoty vypočtené Hornovým postupem a hodnoty klasických odhadů. Mírně se od těchto dvou hodnot odchylují hodnoty robustních odhadů. Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 14

Porovnání parametrů Metoda Odhad polohy Odhad míry Interval spolehlivosti rozptýlení Spodní Horní Hornův postup 50,05 17,7 40,06 60,03 Klasické odhady 49,16 7,84 41,32 57,00 Robustní odhady 47,40 12,72 35,52 59,28 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 15

3. Statistické testování Test správnosti Zadání Byl testován nový výškoměr Vertex, kdy byla dána kontrolní výška stromu 10 m a pak byla měřena výška v 30-ti opakováních. Cílem úlohy je posoudit, zda výškoměr měří správně. Data - naměřené kontrolní výšky v m stromu o dané výšce 10 m Tab. 1: Vstupní data - naměřené kontrolní výšky v m stromu o dané výšce 10 m, n = 30 10.3 9.8 10.4 10.0 10.2 10.1 11.6 9.8 10.0 9.7 10.3 9.9 10.9 9.6 10.4 10.2 10.0 9.6 10.1 9.9 10.0 10.0 9.8 9.9 10.0 10.1 9.8 9.9 10.3 10.0 Užitý program - QC Expert Output Analýza jednorozměrného výběru Klasické odhady parametrů Průměr = 10,0866 Směrodatná odchylka = 0,3919 Dolní mez 95 % intervalu spolehlivosti = 9,9403 Horní mez 95 % intervalu spolehlivosti = 10,2330 Robustní odhady parametrů Medián = 10,00 Směrodatná odchylka = 0,0510 Dolní mez 95 % intervalu spolehlivosti = 9,8956 Horní mez 95 % intervalu spolehlivosti = 10,1043 Závěr S 95 % statistickou jistotou byly nalezeny intervalové odhady měření výšky novým výškoměrem pro aritmetický průměr v rozmezí 9,94 10,23 m, pro medián 9,89 10,10 m. Naměřené výsledky vyhovují pro měření novým výškoměrem Vertex v případě klasických i robustních postupů. Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 16

Test shodnosti Zadání V rámci řešení projektu COST LD14018 - Udržitelné hospodaření smíšených lesů vrchovin Toky látek a biogeochemické koloběhy živin v roce 2014 byla změřena výčetní tloušťka (d 1,3 ) všech stromů ve smíšeném porostu modřínu s bukem (MD/BK) a smrku s bukem (SM/BK) ve věku cca 33 let v oblasti Drahanské vrchoviny. Cílem úlohy je posoudit zda dřevina buk (BK) je stejně tloušťkově vyspělá ve smíšení se smrkem i modřínem. Data - výčetní tloušťky (d 1,3 ) stromů dřeviny buk (BK) v cm v porostu SM/BK a MD/BK Tab. 1: Vstupní data - tloušťky (d 1,3 ) stromů dřeviny buk (BK) v cm v porostu SM/BK, n = 97 2.30 3.00 4.60 5.60 7.30 8.25 9.25 10.75 11.70 14.65 2.50 3.60 4.65 6.00 7.40 8.30 9.25 11.25 11.80 14.80 2.50 3.65 4.70 6.05 7.65 8.65 9.30 11.30 11.90 17.20 2.50 3.75 4.70 6.25 7.75 8.65 9.30 11.35 12.05 17.85 2.55 3.85 4.80 6.50 7.85 8.70 9.75 11.40 12.10 18.15 2.60 4.00 4.95 6.70 7.85 8.75 9.75 11.40 12.45 19.35 2.70 4.00 4.95 6.80 7.95 8.80 9.75 11.45 13.00 21.50 2.90 4.00 5.40 6.85 8.00 9.00 10.00 11.50 13.10 3.00 4.25 5.40 6.90 8.05 9.00 10.10 11.50 13.80 3.00 4.35 5.50 7.20 8.10 9.00 10.40 11.65 14.10 Tab. 2: Vstupní data - tloušťky (d 1,3 ) stromů dřeviny buk (BK) v cm v porostu MD/BK, n = 97 1.00 3.60 5.30 7.35 8.60 9.40 10.85 12.50 13.50 17.50 1.40 3.65 5.80 7.45 8.75 9.40 10.95 12.50 14.00 17.55 1.50 3.70 5.85 7.50 8.80 9.50 11.20 12.50 14.15 17.95 1.50 4.00 5.90 7.65 8.90 9.70 11.25 12.50 14.35 18.30 1.85 4.25 6.15 7.70 9.10 9.80 11.25 12.70 14.40 18.35 2.05 4.50 6.25 7.80 9.20 10.00 11.40 12.90 14.50 19.35 2.75 4.85 6.80 8.00 9.25 10.00 11.45 12.95 14.70 21.40 2.80 5.10 7.20 8.00 9.25 10.20 11.50 13.10 15.75 3.30 5.15 7.25 8.20 9.35 10.25 11.50 13.10 16.25 3.50 5.20 7.25 8.35 9.40 10.80 12.35 13.20 17.25 Užitý program - ADSTAT - QC Expert Output Pro řešení úlohy byly stanoveny hypotézy: - H0: Dřevina buk (BK) je stejně tloušťkově vyspělá ve smíšení se smrkem i modřínem - HA: Dřevina buk (BK) není stejně tloušťkově vyspělá ve smíšení se smrkem i modřínem Hladina významnosti je stanovena na 0,05, tj. pro zamítnutí nulové hypotézy je třeba pravděpodobnost nejméně 95%. Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 17

(1) KLASICKÉ ODHADY PARAMETRŮ: Parametr Výběr 1 Výběr 2 Celkem Velikost výběru 97 97 194 Průměr 9.4634E+00 8.2928E+00 8.8781E+00 Rozptyl 2.0719E+01 1.6920E+01 1.8722E+01 Šikmost 2.4466E-01 7.2042E-01 4.4839E-01 Špičatost 2.6302E+00 3.4489E+00 2.9879E+00 (2) TEST HOMOGENITY ROZPTYLU (hypotézy H0: s1^2=s2^2): Fisher-Snedecor F-test: Počet stupňů volnosti Df1: 96 Df2: 96 Tabulkový kvantil F(1-alfa/2,Df1,Df2): 1.4955E+00 F-statistika: 1.2245E+00 Závěr: Rozptyly se považují za shodné, H0 přijata Vypočtená hladina významnosti: 0.161 Korigovaný F-test : Počet stupňů volnosti Df1: 96 Df2: 96 Tabulkový kvantil F(1-alfa/2,Df1,Df2): 1.4955E+00 F-statistika: 1.2245E+00 Závěr: Rozptyly se považují za shodné, H0 přijata Vypočtená hladina významnosti: 0.161 Jacknife F-test Počet stupňů volnosti Df1: 2 Df2: 192 Tabulkový kvantil F(1-alfa/2,Df1,Df2) : 3.7607E+00 F-statistika: 8.5990E-01 Závěr: Rozptyly se považují za shodné, H0 přijata Vypočtená hladina významnosti: 0.425 (3) TEST SHODY PRUMĚRU (hypotézaza H0: průměr1=průměr2): Shoda rozptylu se dá předpokládat. t-test (pro shodné rozptyly) Počet stupňů volnosti Df1: 192 Tabulkový kvantil t(1-alfa/2,df1): 1.9724E+00 t-statistika: 2.3595E-01 Závěr: Průměry se považují za shodné, H0 přijata Vypočtená hladina významnosti: 0.814 t-test (pro různé rozptyly) Počet stupňů volnosti Df1: 192 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 18

Tabulkový kvantil t(1-alfa/2,df1): 1.9724E+00 t-statistika: 1.8792E+00 Závěr: Průměry se považují za shodné, H0 přijata Vypočtená hladina významnosti: 0.062 Základní předpoklady výběrů Q-výběr 30 20 10 0 Q-Q graf pro dva výběry - Sheet1 C E E C Krabicový graf - Sheet1-10 -4-3 -2-1 0 1 2 3 4 PDF 0.100 0.090 0.080 0.070 0.060 0.050 0.040 0.030 0.020 Jádrový odhad hustoty - Sheet1 0.010 X 0.000-10 0 10 20 30 Q-norm C E 0 10 20 30 PDF Hustota normálního rozdělení - Sheet1 0.100 0.090 0.080 0.070 0.060 0.050 0.040 0.030 0.020 0.010 X 0.000 0 10 20 30 C E x2 Empirický FF-graf - Sheet1 1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0-0.2 x1-0.4-0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 C E P(Xi<X) Empirické distribuční funkce - Sheet1 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 X 0.00-10 0 10 20 30 C E Test dobré shody rozdělení QC Expert dvouvýběrový K-S test Diference DF: 0,1649484536 Kritická hodnota: 0,1950120127 Závěr: Rozdělení jsou SHODNÁ Závěr Při porovnání středních hodnot analyzovaných výběrů a shody rozptylů byla zjištěna jejich shoda. Test shodnosti prokázal, že na hladině významnosti 0,05 je tloušťková struktura dřeviny BK shodná jak ve smíšení se smrkem (SM) tak i ve smíšení s modřínem (MD). Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 19

Použitá literatura Barilla, J., Smir, P. 2008: Microsoft Excel pro techniky a inženýry. Computer Press, vyd. 1., Brno: 366 s. ISBN 978-80-251-2421-5 (brož.) Meloun, M., Militký, J. 2012: Interaktivní statistická analýza dat. 4. vyd. Praha: Karolinum Praha. 955 s. ISBN 978-80-246-2173-9. Meloun, M., Militký, J. 2012: Kompendium statistického zpracování dat. 3. vyd. Praha: Karolinum Praha. 985 s. ISBN 978-80-246-2196-8. Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 20