Univerzita Pardubice Fakulta chemicko-technologická, Katedra analytické chemie Licenční studium GALILEO Interaktivní statistická analýza dat Semestrální práce z předmětu Statistická analýza jednorozměrných dat Vypracoval Ing. Ladislav Menšík, Ph.D. Ústav ekologie lesa Mendelova univerzita v Brně Lesnická a dřevařská fakulta Brno srpen, 2015 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 1
Obsah Úvod...3 1. Statistická analýza velkých výběrů...4 2. Statistická analýza malých výběrů dle Horna... 11 3. Statistické testování... 16 Použitá literatura... 20 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 2
Úvod Při lesnickém výzkumu dochází k pořizování různých typů výzkumných dat s velkými výběry (n > 30) i data velmi malých výběrů (n > 10; n > 4). Pro hodnocení musí být použity různé korektní postupy a metody statistické analýzy dat včetně různých typů software. Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 3
1. Statistická analýza velkých výběrů Zadání V rámci řešení projektu COST LD14018 - Udržitelné hospodaření smíšených lesů vrchovin Toky látek a biogeochemické koloběhy živin v roce 2014 byla změřena výčetní tloušťka (d 1,3 ) všech stromů ve smíšeném porostu modřínu s bukem ve věku cca 33 let v oblasti Drahanské vrchoviny. Cílem úlohy je na větším výběru dat (n > 30) aplikovat obecný postup analýzy jednorozměrného výběru. Data - výčetní tloušťky (d 1,3 ) stromů dřeviny modřín (MD) v cm Tab. 1: Vstupní data - výčetní tloušťky (d 1,3 ) stromů dřeviny modřín (MD) v cm, n = 100 34.00 29.25 27.60 20.25 32.15 18.10 31.70 20.05 20.25 17.20 29.75 36.15 28.75 30.25 32.00 30.65 24.00 20.35 25.20 24.65 27.95 31.00 22.00 30.00 32.40 28.75 21.75 30.05 26.75 25.70 30.50 19.75 32.20 35.15 26.25 20.60 28.90 15.15 27.00 24.50 18.10 34.20 29.65 6.50 16.60 13.65 14.55 20.90 20.85 24.10 21.75 26.85 22.35 26.05 24.95 16.85 20.10 26.30 26.00 25.35 29.60 31.25 12.75 22.70 14.15 20.60 25.75 23.95 23.70 28.40 27.95 27.40 18.55 28.50 26.80 21.90 27.30 28.25 15.40 35.25 23.65 31.00 36.75 15.00 22.20 38.40 26.05 27.85 23.50 20.25 33.45 24.40 26.60 29.75 31.30 26.30 28.10 25.90 21.00 27.50 Užitý program - ADSTAT - QC Expert - Průzkumová analýza dat (EDA) - průzkum statistických zvláštností dat symetrie, špičatost, lokální koncentrace, přítomnost odlehlých bodů. Obrázky Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 4
Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 5
Četnost 30 Histogram - Sheet1 - A Kvantil-Data 40 Q-Q Graf - Sheet1 - A 20 30 20 10 10 A 0 0 10 20 30 40 0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 Kvantil-Norm Diagramy rozptýlení - Sheet1 - A Hustota 0.070 0.060 0.050 0.040 0.030 0.020 Odhad hustoty - Sheet1 - A 0 10 20 30 40 A 0.010 A 0.000-10 0 10 20 30 40 50 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 6
Krabicový graf - Sheet1 - A r 0.30 0.20 0.10 0.00-0.10-0.20 Autokorelace - Sheet1 - A 0 10 20 30 40 A -0.30 Řád 1.0 2.0 3.0 4.0 A 40 Trendy vyhlazení - Sheet1 - A A 40 Kvantilový graf - Sheet1 - A 30 20 Data Průměr Medián 30 20 10 10 i 0 0 10 20 30 40 50 60 70 80 90 100 P 0 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 P-P Graf - Sheet1 - A Normal Uniform Laplace p-data 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 p-teor 0.00 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 A Graf rozptýlení s kv antily - Sheet1 - A 40 30 20 10 P 0 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 Poloha 27.0 Graf polosum - Sheet1 - A Poloha 27.0 Graf symetrie - Sheet1 - A 26.0 26.0 25.0 25.0 24.0 24.0 23.0 23.0 A 22.0 0 10 20 30 40 22.0 x 0.0 1.0 2.0 3.0 y 2.6 2.4 2.2 2.0 1.8 1.6 1.4 Graf špičatosti - Sheet1 - A 1.2 1.0 0.8 x 0.0 1.0 2.0 3.0 Kruhový Graf - Sheet1 - A y 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 x 0.00-0.50-0.40-0.30-0.20-0.10 0.00 0.10 0.20 0.30 0.40 0.50 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 7
Output 1) Klasické odhady parametrů: Parametr ADSTAT QC Expert Průměr 25,33 25,33 Medián 26,05 26,05 Šikmost -0,39-0,39 Špičatost 3,11 3,11 Směrodatná odchylka 5,93 5,93 2) Test normality: Tabulkový kvantil Chi^2(1-alfa,2): 5.9915E+00 Chi^2-statistika: 2.9596E+00 Závěr: Předpoklad normality přijat Vypočtená hladina významnosti: 2.2768E-01 3) Test nezávislosti: Tabulkový kvantil t(1-alfa/2,n+1): 1.9837E+00 Test autokorelace: 6.3907E-01 Závěr: Předpoklad nezávislosti přijat Vypočtená hladina významnosti: 2.6211E-01 Předpoklad homogenity výběru: Aritmetický průměr: 2.5334E+01 Rozptyl: 3.5184E+01 Směrodatná odchylka: 5.9316E+00 Vnitřní meze: Spodní mez: 1.7435E+00 Horní mez: 4.8831E+01 4) Minimální velikost vývěru: pro 25% relativní chybu směrodatné odchylky: n = 9 pro 10% relativní chybu směrodatné odchylky: n = 54 pro 5% relativní chybu směrodatné odchylky: n = 212 5) Detekce odlehlých bodů: Ve výběru nejsou odlehlé body. 6) Porovnání rozdělení: LINEARITA V GRAFU KVANTIL-KVANTIL (Q-Q): Rozdělení Směrnice Úsek Korelační koeficient 0 Laplaceovo 4.2640E+00 2.5334E+01 9.8109E-01 1 Normální 5.9569E+00 2.5334E+01 9.9291E-01 2 Exponenciální 5.3326E+00 2.0049E+01 8.6992E-01 3 Rovnoměrné 1.9919E+01 1.5375E+01 9.7180E-01 4 Lognormální 2.5020E+00 2.1315E+01 7.7751E-01 5 Gumbelovo 4.6773E+00 2.8001E+01 9.8862E-01 6Weibullovo( 0.5) 1.0503E+00 2.3329E+01 6.6803E-01 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 8
6Weibullovo( 1.0) 5.3326E+00 2.0049E+01 8.6992E-01 6Weibullovo( 1.5) 9.2089E+00 1.7050E+01 9.3786E-01 6Weibullovo( 2.0) 1.2490E+01 1.4285E+01 9.6651E-01 6Weibullovo( 2.5) 1.5431E+01 1.1656E+01 9.8043E-01 6Weibullovo( 3.0) 1.8177E+01 9.1101E+00 9.8782E-01 6Weibullovo( 3.5) 2.0806E+01 6.6173E+00 9.9195E-01 6Weibullovo( 4.0) 2.3361E+01 4.1600E+00 9.9435E-01 6Weibullovo( 4.5) 2.5865E+01 1.7275E+00 9.9574E-01 6Weibullovo( 5.0) 2.8335E+01-6.8712E-01 9.9655E-01 6Weibullovo( 5.5) 3.0780E+01-3.0884E+00 9.9699E-01 6Weibullovo( 6.0) 3.3205E+01-5.4796E+00 9.9720E-01 6Weibullovo( 6.5) 3.5617E+01-7.8629E+00 9.9726E-01 6Weibullovo( 7.0) 3.8017E+01-1.0240E+01 9.9723E-01 6Weibullovo( 7.5) 4.0409E+01-1.2612E+01 9.9713E-01 6Weibullovo( 8.0) 4.2793E+01-1.4980E+01 9.9700E-01 7 Logistické 3.3201E+00 2.5334E+01 9.9154E-01 8 Cauchyho 5.0368E-01 2.5334E+01 7.0513E-01 7) Transformace dat: PROSTÁ MOCNINNÁ TRANSFORMACE: Optimální mocnina: 1.6000E+00 pro šikmost: 2.3271E-02 Optimální mocnina: 2.0000E+00 pro asymetrii: 1.3678E-03 Optimální mocnina: 3.0667E+00 pro asymetrii, rob.: 3.9361E-03 Optimální mocnina:-3.7333e+00 pro Hinkley-asymetrii: 8.8949E-06 Zvolená mocnina: 1.60 Průměr: 1.8086E+02 Rozptyl: 4.0953E+03 Směrodatná odchylka: 6.3995E+01 Šikmost: 2.3271E-02 Špičatost: 2.7182E+00 Opravený průměr: 2.5754E+01 BOX-COXOVA TRANSFORMACE: Optimální mocnina: 1.6000E+00 pro šikmost: 2.3271E-02 Optimální mocnina: 2.4000E+00 pro špičatost: 3.0154E+00 Optimální mocnina: 2.0000E+00 pro asymetrii: 1.3678E-03 Optimální mocnina: 3.0667E+00 pro asymetrii, rob.: 3.9361E-03 Optimální mocnina:-3.4667e+00 pro Hinkley-asymetrii: 2.2237E-06 Optimální mocnina: 1.4667E+00 pro věrohodnost:-1.7685e+02 Zvolená mocnina: 1.60 Průměr: 1.1241E+02 Rozptyl: 1.5997E+03 Směrodatná odchylka: 3.9997E+01 Šikmost: 2.3271E-02 Špičatost: 2.7182E+00 Opravený průměr: 2.5754E+01 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 9
Závěr Z diagnostických grafů vyplynulo, že rozdělení dat je blízké normálnímu, což bylo prokázáno například analýzou špičatosti. Průzkumová analýza dat dále potvrdila homogenitu dat a byl přijat předpoklad normality dat, dále test nezávislosti prokázal, že data jsou nezávislá. Klasické odhady parametrů programy ADSTAT i QC Expert přinesly shodné údaje. Test odlehlých bodů programem ADSTAT i QC Expert ne našel odlehlý bod, ale na krabicových grafech jsou zobrazeny. Rozdíl mezi průměrem a mediánem není významný, což ukazuje na normální rozdělení. Stanovená hypotéza, že transformace dat byla nutná, se zamítá, a to pomocí dvou metod transformace - prostá mocninná, Box- Coxova. Jelikož výsledkem každé transformace byla jiná hodnota průměru. Doporučením je uvádět aritmetický průměr, který se výrazně neliší od mediánu, ani od opravených průměrů vypočtených transformací. Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 10
2. Statistická analýza malých výběrů dle Horna Zadání V oblasti Drahanské vrchoviny jsou měřeny a hodnoceny koncentrace (mg.l -1 ) rozpustného organického uhlíku (DOC) v průsakových vodách pod nadložním humusem ve smrkovém porostu. Cílem úlohy 2 je pomocí Hornovy metody pivotů určit parametry polohy a rozptýlení. Výsledky budou porovnány s klasickými a robustními odhady polohy a rozptýlení pomocí zvoleného software. Pro zpracování dat bude využito programu ADSTAT a QC Expert.. Data - koncentrace DOC (mg.l -1 ) v průsakových vodách pod nadložním humusem v letech 2006-2013 Tab. 1: Vstupní data - koncentrace DOC (mg.l -1 ) v průsakových vodách pod nadložním humusem v letech 2006-2013, n = 8, sudé 2006 2007 2008 2009 2010 2011 2012 2013 59.5 49.5 55.2 58.9 41.2 45.3 43.8 39.9 Užitý program - MS Excel Řešení 1) Uspořádání dat vzestupně i 1 2 3 4 5 6 7 8 x(i) 39.9 41.2 43.8 45.3 49.5 55.2 58.9 59.5 2) Hloubka pivotu H = (int ((n + 1) / 2)) / 2 H = (int ((8 + 1) / 2)) / 2 = 2,25 --- 2 3) Pivoty Dolní pivot: = = (3) = 41,2 Horní pivot: = ( +1 ) =58,9 4) Pivotová polosuma PL = ( + ) / 2 = 50,05 5) Pivotové rozpětí RL = = 17,7 6) 95% interval spolehlivosti střední hodnoty μ K výpočtu byla použita tabulka kvantilů dle Meloun, Militký (2012) str. 154:,1 2( ) = 0,564.,1 2( ) μ +,1 2( ) Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 11
50,05 17,7 0,564 μ 50,05 + 17,7 0,564 40,0672 μ 60,0328 7) Ověření vypočtených hodnot programem QC Expert Střední hodnota: 50,05 Spodní mez (2,5 %): 40,0672 Horní mez (97,5 %): 60,0328 Pivotové rozpětí: 17,7 Závěr Bodový odhad polohy v případě odhadu míry polohy obsahu DOC v průsakových vodách pod nadložním humusem ve smrkovém porostu je 50,05 mg.l -1. Míra rozptýlení je 17,7 mg.l -1. Lze konstatovat, že s 95% statistickou jistotou leží obsah DOC v průsakových vodách pod nadložním humusem ve smrkovém porostu v intervalu 40,1 až 60,0 mg.l -1. Porovnání s klasickými a robustními odhady polohy a rozptýlení Užitý program - ADSTAT - QC Expert Output Základní předpoklady (1) KLASICKÉ ODHADY PARAMETRŮ Medián: 4.7400E+01 Průměr: 4.9163E+01 Rozptyl: 6.1588E+01 Šikmost: 2.3281E-01 Špičatost: 1.4707E+00 Směrodatná odchylka: 7.8478E+00 (2) TEST NORMALITY: Tabulkový kvantil Chi^2(1-alfa,2): 5.9915E+00 Chi^2-statistika: 1.6454E+00 Závěr: Předpoklad normality přijat Vypočten hladina významnosti: 4.3925E-01 (3) TEST NEZÁVISLOSTI: Tabulkový kvantil t(1-alfa/2,n+1) : 2.2622E+00 Test autokorelace : 1.5419E+00 Závěr: Předpoklad nezávislosti přijat Vypočtená hladina významnosti: 7.8748E-02 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 12
Předpoklad homogenity výběru: Aritmetický průměr: 4.9163E+01 Rozptyl: 6.1588E+01 Směrodatná odchylka: 7.8478E+00 Vnitřní meze: Spodní mez: 1.6310E+01 Horní mez: 8.3240E+01 (4) MINIMÁLNÍ VELIKOST VÝBĚRU: pro 25% relativní chybu směrodatné odchylky: n = 3 pro 10% relativní chybu směrodatné odchylky: n = 13 pro 5% relativní chybu směrodatné odchylky: n = 48 (5) DETEKCE ODLEHLÝCH BODŮ: Ve výběru nejsou odlehlé body (6) POROVNÁNÍ ROZDĚLENÍ: Rozdělení Směrnice Úsek Korelační koeficient 0 Laplaceovo 6.3627E+00 4.9163E+01 9.3449E-01 1 Normální 8.1454E+00 4.9163E+01 9.6526E-01 2 Exponenci lní 8.7308E+00 4.1051E+01 9.3230E-01 3 Rovnoměrné 2.5938E+01 3.6193E+01 9.8133E-01 4 Lognormální 5.4064E+00 4.1428E+01 8.9547E-01 5 Gumbelovo 6.4807E+00 5.2558E+01 9.3496E-01 6Weibullovo( 0.5) 2.7714E+00 4.5068E+01 8.0237E-01 6Weibullovo( 1.0) 8.7308E+00 4.1051E+01 9.3230E-01 6Weibullovo( 1.5) 1.3437E+01 3.7397E+01 9.6212E-01 6Weibullovo( 2.0) 1.7431E+01 3.3939E+01 9.6847E-01 6Weibullovo( 2.5) 2.1102E+01 3.0573E+01 9.6853E-01 6Weibullovo( 3.0) 2.4612E+01 2.7253E+01 9.6679E-01 6Weibullovo( 3.5) 2.8034E+01 2.3958E+01 9.6464E-01 6Weibullovo( 4.0) 3.1403E+01 2.0679E+01 9.6250E-01 6Weibullovo( 4.5) 3.4739E+01 1.7410E+01 9.6053E-01 6Weibullovo( 5.0) 3.8053E+01 1.4148E+01 9.5876E-01 6Weibullovo( 5.5) 4.1351E+01 1.0890E+01 9.5718E-01 6Weibullovo( 6.0) 4.4638E+01 7.6349E+00 9.5577E-01 6Weibullovo( 6.5) 4.7917E+01 4.3828E+00 9.5451E-01 6Weibullovo( 7.0) 5.1189E+01 1.1327E+00 9.5339E-01 6Weibullovo( 7.5) 5.4457E+01-2.1160E+00 9.5238E-01 6Weibullovo( 8.0) 5.7720E+01-5.3635E+00 9.5148E-01 7 Logistick 4.7121E+00 4.9163E+01 9.5598E-01 8 Cauchyho 2.9305E+00 4.9163E+01 8.7946E-01 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 13
9 Paretovo( 0.5) 8.2849E-02 4.6852E+01 6.3019E-01 9 Paretovo( 1.0) 1.4735E+00 4.3771E+01 7.6437E-01 9 Paretovo( 1.5) 4.2772E+00 3.9866E+01 8.2413E-01 9 Paretovo( 2.0) 7.7594E+00 3.5709E+01 8.5417E-01 9 Paretovo( 2.5) 1.1570E+01 3.1457E+01 8.7165E-01 9 Paretovo( 3.0) 1.5558E+01 2.7160E+01 8.8292E-01 9 Paretovo( 3.5) 1.9651E+01 2.2841E+01 8.9075E-01 9 Paretovo( 4.0) 2.3811E+01 1.8508E+01 8.9647E-01 9 Paretovo( 4.5) 2.8016E+01 1.4166E+01 9.0083E-01 9 Paretovo( 5.0) 3.2253E+01 9.8193E+00 9.0426E-01 9 Paretovo( 5.5) 3.6514E+01 5.4685E+00 9.0702E-01 9 Paretovo( 6.0) 4.0791E+01 1.1148E+00 9.0929E-01 9 Paretovo( 6.5) 4.5083E+01-3.2410E+00 9.1119E-01 9 Paretovo( 7.0) 4.9384E+01-7.5983E+00 9.1280E-01 9 Paretovo( 7.5) 5.3695E+01-1.1957E+01 9.1419E-01 9 Paretovo( 8.0) 5.8012E+01-1.6316E+01 9.1539E-01 10 Gamma( 0.5) 1.3457E+01 4.3357E+01 8.9460E-01 10 Gamma( 1.0) 8.9032E+00 4.0913E+01 9.3773E-01 10 Gamma( 1.5) 7.0900E+00 3.9064E+01 9.5080E-01 10 Gamma( 2.0) 6.0589E+00 3.7511E+01 9.5679E-01 10 Gamma( 2.5) 5.3743E+00 3.6144E+01 9.6013E-01 10 Gamma( 3.0) 4.8779E+00 3.4910E+01 9.6220E-01 10 Gamma( 3.5) 4.4971E+00 3.3776E+01 9.6359E-01 10 Gamma( 4.0) 4.1931E+00 3.2721E+01 9.6457E-01 10 Gamma( 4.5) 3.9432E+00 3.1730E+01 9.6529E-01 10 Gamma( 5.0) 3.7330E+00 3.0793E+01 9.6583E-01 10 Gamma( 5.5) 3.5531E+00 2.9903E+01 9.6624E-01 10 Gamma( 6.0) 3.3969E+00 2.9052E+01 9.6657E-01 10 Gamma( 6.5) 3.2595E+00 2.8235E+01 9.6683E-01 10 Gamma( 7.0) 3.1375E+00 2.7450E+01 9.6704E-01 10 Gamma( 7.5) 3.0282E+00 2.6693E+01 9.6721E-01 10 Gamma( 8.0) 2.9296E+00 2.5960E+01 9.6735E-01 (7) ROBUSTNÍ ODHADY PARAMETRŮ: Medián: 4.7400E+01 Směrodatná odchylka mediánu: 1.2728E+01 Rozptyl mediánu: 1.6201E+02 95.0% spolehlivost: Spodní mez: 3.5520E+01 Horní mez: 5.9280E+01 Závěr Výsledky byly porovnány s klasickými a robustními odhady polohy a rozptýlení pomocí zvoleného software ADSTAT. Z výsledků ověření dat vyplývá, že data vykazují rozdělení normální (rovnoměrné). Ve výběru nejsou odlehlé body. Z tabulky vyplývá, že všechny metody uvádí obdobné hodnoty. Celkově bližší jsou si hodnoty vypočtené Hornovým postupem a hodnoty klasických odhadů. Mírně se od těchto dvou hodnot odchylují hodnoty robustních odhadů. Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 14
Porovnání parametrů Metoda Odhad polohy Odhad míry Interval spolehlivosti rozptýlení Spodní Horní Hornův postup 50,05 17,7 40,06 60,03 Klasické odhady 49,16 7,84 41,32 57,00 Robustní odhady 47,40 12,72 35,52 59,28 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 15
3. Statistické testování Test správnosti Zadání Byl testován nový výškoměr Vertex, kdy byla dána kontrolní výška stromu 10 m a pak byla měřena výška v 30-ti opakováních. Cílem úlohy je posoudit, zda výškoměr měří správně. Data - naměřené kontrolní výšky v m stromu o dané výšce 10 m Tab. 1: Vstupní data - naměřené kontrolní výšky v m stromu o dané výšce 10 m, n = 30 10.3 9.8 10.4 10.0 10.2 10.1 11.6 9.8 10.0 9.7 10.3 9.9 10.9 9.6 10.4 10.2 10.0 9.6 10.1 9.9 10.0 10.0 9.8 9.9 10.0 10.1 9.8 9.9 10.3 10.0 Užitý program - QC Expert Output Analýza jednorozměrného výběru Klasické odhady parametrů Průměr = 10,0866 Směrodatná odchylka = 0,3919 Dolní mez 95 % intervalu spolehlivosti = 9,9403 Horní mez 95 % intervalu spolehlivosti = 10,2330 Robustní odhady parametrů Medián = 10,00 Směrodatná odchylka = 0,0510 Dolní mez 95 % intervalu spolehlivosti = 9,8956 Horní mez 95 % intervalu spolehlivosti = 10,1043 Závěr S 95 % statistickou jistotou byly nalezeny intervalové odhady měření výšky novým výškoměrem pro aritmetický průměr v rozmezí 9,94 10,23 m, pro medián 9,89 10,10 m. Naměřené výsledky vyhovují pro měření novým výškoměrem Vertex v případě klasických i robustních postupů. Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 16
Test shodnosti Zadání V rámci řešení projektu COST LD14018 - Udržitelné hospodaření smíšených lesů vrchovin Toky látek a biogeochemické koloběhy živin v roce 2014 byla změřena výčetní tloušťka (d 1,3 ) všech stromů ve smíšeném porostu modřínu s bukem (MD/BK) a smrku s bukem (SM/BK) ve věku cca 33 let v oblasti Drahanské vrchoviny. Cílem úlohy je posoudit zda dřevina buk (BK) je stejně tloušťkově vyspělá ve smíšení se smrkem i modřínem. Data - výčetní tloušťky (d 1,3 ) stromů dřeviny buk (BK) v cm v porostu SM/BK a MD/BK Tab. 1: Vstupní data - tloušťky (d 1,3 ) stromů dřeviny buk (BK) v cm v porostu SM/BK, n = 97 2.30 3.00 4.60 5.60 7.30 8.25 9.25 10.75 11.70 14.65 2.50 3.60 4.65 6.00 7.40 8.30 9.25 11.25 11.80 14.80 2.50 3.65 4.70 6.05 7.65 8.65 9.30 11.30 11.90 17.20 2.50 3.75 4.70 6.25 7.75 8.65 9.30 11.35 12.05 17.85 2.55 3.85 4.80 6.50 7.85 8.70 9.75 11.40 12.10 18.15 2.60 4.00 4.95 6.70 7.85 8.75 9.75 11.40 12.45 19.35 2.70 4.00 4.95 6.80 7.95 8.80 9.75 11.45 13.00 21.50 2.90 4.00 5.40 6.85 8.00 9.00 10.00 11.50 13.10 3.00 4.25 5.40 6.90 8.05 9.00 10.10 11.50 13.80 3.00 4.35 5.50 7.20 8.10 9.00 10.40 11.65 14.10 Tab. 2: Vstupní data - tloušťky (d 1,3 ) stromů dřeviny buk (BK) v cm v porostu MD/BK, n = 97 1.00 3.60 5.30 7.35 8.60 9.40 10.85 12.50 13.50 17.50 1.40 3.65 5.80 7.45 8.75 9.40 10.95 12.50 14.00 17.55 1.50 3.70 5.85 7.50 8.80 9.50 11.20 12.50 14.15 17.95 1.50 4.00 5.90 7.65 8.90 9.70 11.25 12.50 14.35 18.30 1.85 4.25 6.15 7.70 9.10 9.80 11.25 12.70 14.40 18.35 2.05 4.50 6.25 7.80 9.20 10.00 11.40 12.90 14.50 19.35 2.75 4.85 6.80 8.00 9.25 10.00 11.45 12.95 14.70 21.40 2.80 5.10 7.20 8.00 9.25 10.20 11.50 13.10 15.75 3.30 5.15 7.25 8.20 9.35 10.25 11.50 13.10 16.25 3.50 5.20 7.25 8.35 9.40 10.80 12.35 13.20 17.25 Užitý program - ADSTAT - QC Expert Output Pro řešení úlohy byly stanoveny hypotézy: - H0: Dřevina buk (BK) je stejně tloušťkově vyspělá ve smíšení se smrkem i modřínem - HA: Dřevina buk (BK) není stejně tloušťkově vyspělá ve smíšení se smrkem i modřínem Hladina významnosti je stanovena na 0,05, tj. pro zamítnutí nulové hypotézy je třeba pravděpodobnost nejméně 95%. Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 17
(1) KLASICKÉ ODHADY PARAMETRŮ: Parametr Výběr 1 Výběr 2 Celkem Velikost výběru 97 97 194 Průměr 9.4634E+00 8.2928E+00 8.8781E+00 Rozptyl 2.0719E+01 1.6920E+01 1.8722E+01 Šikmost 2.4466E-01 7.2042E-01 4.4839E-01 Špičatost 2.6302E+00 3.4489E+00 2.9879E+00 (2) TEST HOMOGENITY ROZPTYLU (hypotézy H0: s1^2=s2^2): Fisher-Snedecor F-test: Počet stupňů volnosti Df1: 96 Df2: 96 Tabulkový kvantil F(1-alfa/2,Df1,Df2): 1.4955E+00 F-statistika: 1.2245E+00 Závěr: Rozptyly se považují za shodné, H0 přijata Vypočtená hladina významnosti: 0.161 Korigovaný F-test : Počet stupňů volnosti Df1: 96 Df2: 96 Tabulkový kvantil F(1-alfa/2,Df1,Df2): 1.4955E+00 F-statistika: 1.2245E+00 Závěr: Rozptyly se považují za shodné, H0 přijata Vypočtená hladina významnosti: 0.161 Jacknife F-test Počet stupňů volnosti Df1: 2 Df2: 192 Tabulkový kvantil F(1-alfa/2,Df1,Df2) : 3.7607E+00 F-statistika: 8.5990E-01 Závěr: Rozptyly se považují za shodné, H0 přijata Vypočtená hladina významnosti: 0.425 (3) TEST SHODY PRUMĚRU (hypotézaza H0: průměr1=průměr2): Shoda rozptylu se dá předpokládat. t-test (pro shodné rozptyly) Počet stupňů volnosti Df1: 192 Tabulkový kvantil t(1-alfa/2,df1): 1.9724E+00 t-statistika: 2.3595E-01 Závěr: Průměry se považují za shodné, H0 přijata Vypočtená hladina významnosti: 0.814 t-test (pro různé rozptyly) Počet stupňů volnosti Df1: 192 Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 18
Tabulkový kvantil t(1-alfa/2,df1): 1.9724E+00 t-statistika: 1.8792E+00 Závěr: Průměry se považují za shodné, H0 přijata Vypočtená hladina významnosti: 0.062 Základní předpoklady výběrů Q-výběr 30 20 10 0 Q-Q graf pro dva výběry - Sheet1 C E E C Krabicový graf - Sheet1-10 -4-3 -2-1 0 1 2 3 4 PDF 0.100 0.090 0.080 0.070 0.060 0.050 0.040 0.030 0.020 Jádrový odhad hustoty - Sheet1 0.010 X 0.000-10 0 10 20 30 Q-norm C E 0 10 20 30 PDF Hustota normálního rozdělení - Sheet1 0.100 0.090 0.080 0.070 0.060 0.050 0.040 0.030 0.020 0.010 X 0.000 0 10 20 30 C E x2 Empirický FF-graf - Sheet1 1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0-0.2 x1-0.4-0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 C E P(Xi<X) Empirické distribuční funkce - Sheet1 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 X 0.00-10 0 10 20 30 C E Test dobré shody rozdělení QC Expert dvouvýběrový K-S test Diference DF: 0,1649484536 Kritická hodnota: 0,1950120127 Závěr: Rozdělení jsou SHODNÁ Závěr Při porovnání středních hodnot analyzovaných výběrů a shody rozptylů byla zjištěna jejich shoda. Test shodnosti prokázal, že na hladině významnosti 0,05 je tloušťková struktura dřeviny BK shodná jak ve smíšení se smrkem (SM) tak i ve smíšení s modřínem (MD). Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 19
Použitá literatura Barilla, J., Smir, P. 2008: Microsoft Excel pro techniky a inženýry. Computer Press, vyd. 1., Brno: 366 s. ISBN 978-80-251-2421-5 (brož.) Meloun, M., Militký, J. 2012: Interaktivní statistická analýza dat. 4. vyd. Praha: Karolinum Praha. 955 s. ISBN 978-80-246-2173-9. Meloun, M., Militký, J. 2012: Kompendium statistického zpracování dat. 3. vyd. Praha: Karolinum Praha. 985 s. ISBN 978-80-246-2196-8. Ladislav Menšík, Ústav ekologie lesa LDF, MENDELU v Brně 20