Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru dat) tabulka rozdělení četností (absolutní četnost, relativní četnost, kumulativní četnost, relativní kumulativní četnost) - grafické znázornění dat (polygon četností a součtová křivka pro bodové rozdělení četností, histogram a součtový histogram pro intervalové rozdělení četností) - výpočet charakteristik (k výpočtu použijte aplikaci STAT1 případně statistické funkce EXCELu), ke každé číselné charakteristice uveďte její definici, její vypočítanou hodnotu a slovní komentář interpretaci získaného výsledku. Určete následující charakteristiky: rozsah, minimum, maximum, aritmetický průměr, modus medián, dolní a horní kvartil, dolní a horní decil, průměrnou odchylku od průměru, momentovou a výběrovou směrodatnou odchylku, momentový a výběrový rozptyl, variační koeficient, variační rozpětí, kvartilové a decilové rozpětí, kvartilovou a decilovou odchylku, koeficient šikmosti a špičatosti. - výsledky shrňte do tabulky v následujícím formátu rozsah 60,000 minimum 67,000 maximum 78,000 průměr 72,083 modus 72,000 medián 72,000 dolní kvartil 71,000 horní kvartil 74,000 dolní decil 69,000 horní decil 75,000 průměrná odchylka 1,672 směrodatná odchylka 2,092 výběrová směrodatná odchylka 2,110 rozptyl 4,376 výběrový rozptyl 4,451 variační koeficient 0,029 variační rozpětí 11,000 kvartilové rozpětí 3,000 decilové rozpětí 6,000 kvartilová odchylka 1,500 decilová odchylka 0,750 koeficient šikmosti 0,217 koeficient špičatosti 0,079 - proveďte testy normality (test nulovosti koeficientu šikmosti a špičatosti, kombinovaný test koeficientu šikmosti a špičatost C-test, případně uveďte i výsledky modifikovaných testů) - určete intervaly spolehlivosti prostřední hodnotu (oboustranný, levostranný, pravostranný), v případě normality určete dále intervaly spolehlivosti pro rozptyl a směrodatnou odchylku - zformulujte věcný problém a vyřešte jej pomocí jednovýběrových testů hypotéz
Univerzita Obrany v Brně Fakulta ekonomiky a managementu UO Zápočtová práce ze statistiky Vypracoval: XY Studijní skupina: xy
Charakteristika datového souboru Zde uveďte, kde byla data získána, co vyjadřují a proč jste se rozhodl(a) tato data zpracovávat apod. Základní soubor: popište, co je základním souborem Výběrový soubor: popište, co je základním souborem Statistický znak: popište, co je zkoumaným statistickým znakem Tabulka získaných hodnot 75 75 77 76 76 75 70 76 74 75 75 73 72 73 73 75 73 75 75 75 73 74 75 74 75 73 76 72 75 73 72 72 72 74 77 73 74 75 74 74 73 75 75 73 72 75 75 75 70 73 73 74 74 72 73 75 75 73 75 73 Základní charakteristiky datového souboru: n = 60, x = 70, x = 77 min max Bodové rozdělení četností Legenda k tabulce: n i absolutní četnost: definice p i relativní četnost: definice N i kumulativní četnost: definice F i relativní kumulativní četnost: definice x i n i p i N i F i 70 2 0,03 2 0,03 71 0 0,00 2 0,03 72 7 0,12 9 0,15 73 15 0,25 24 0,40 74 9 0,15 33 0,55 75 21 0,35 54 0,90 76 4 0,07 58 0,97 77 2 0,03 60 1,00 78 0 0,00 60 1,00 Σ 60 1,00 x x
Grafické zobrazení rozdělení četností n i Polygon četností 25 20 15 10 5 0 70 71 72 73 74 75 76 77 78 x i Součtová křivka 70 60 50 40 N i 30 20 10 0 70 71 72 73 74 75 76 77 78 x i Charakteristiky polohy Aritmetický průměr je definován jako součet všech hodnot znaku dělený jejich počtem n 1 x = x = 73,967 n i = 1 Doplňte slovní vysvětlení interpretaci získaného výsledku. i Modus je. Kvantil je Medián Dolní kvartil Horní kvartil Dolní decil Horní decil Charakteristiky variability Variační rozpětí Kvartilové rozpětí Decilové rozpětí Kvartilová odchylka Decilová odchylka Průměrná odchylka Rozptyl
Směrodatná odchylka Výběrový rozptyl Výběrová směrodatná odchylka Variační koeficient Charakteristiky šikmosti a špičatosti Koeficient šikmosti Koeficient špičatosti Číselné charakteristiky rozsah 60,000 minimum 70,000 maximum 77,000 průměr 73,967 modus 75,000 medián 74,000 dolní kvartil 73,000 horní kvartil 75,000 dolní decil 72,000 horní decil 75,100 průměrná odchylka 1,207 směrodatná odchylka 1,472 výběrová směrodatná odchylka 1,484 rozptyl 2,166 výběrový rozptyl 2,202 variační koeficient 0,020 variační rozpětí 7,000 kvartilové rozpětí 2,000 decilové rozpětí 3,100 kvartilová odchylka 1,000 decilová odchylka 0,387 koeficient šikmosti -0,413 koeficient špičatosti 0,108
Testy normality Test o nulové šikmosti Formulujeme hypotézu a alternativu: H α = 0 A : α 0 : 3 3 a3 0,413 Testové kritérium u 3 = = = 1, 373 D( a 3 ) 0,091 6( n 2) 6(60 2) kde D ( a 3 ) = = = 0, 091 ( n + 1)( n + 3) (60 + 1)(60 + 3) Kritický obor: W α = u3, u3 u α, kde u je kvantil rozdělení N (0,1). 1 1 2 α 2 W0,05 : 1, 737 u0,975 1,737 1,960 (neplatí) nulová šikmost je přijatelná Hodnota testového kritéria nepadne do kritického oboru, hypotézu o nulovosti koeficientu šikmosti na hladině významnosti 0,05 nemůžeme zamítnout. Test o nulové špičatosti Formulujeme hypotézu a alternativu: H : α 4 = 0 A : α 4 0 Kombinovaný test koeficientu šikmosti a špičatosti C test normality H: náhodná veličina X má normální rozdělení A: náhodná veličina X nemá normální rozdělení. Pozn. Můžete určit i modifikované varianty daných testů Závěr: Na základě předchozích testů je není normalita přijatelná. Pozn. Uvedené testy normalitu nezamítly, budeme tedy předpokládat, že pracujeme s výběrem z normálního rozdělení. Budeme tedy konstruovat intervaly spolehlivosti pro střední hodnotu (parametr µ) a rozptyl (parametr σ 2 ). Pokud by se normalita zamítla, určili bychom pouze intervaly spolehlivosti pro střední hodnotu (pro výběry velkého rozsahu). Odhady charakteristik základního souboru Intervalové odhady pro střední hodnotu µ
Oboustranný interval spolehlivosti Parametr µ se s 95% spolehlivostí nalézá v intervalu. Levostranný interval spolehlivosti Parametr µ je s 95% spolehlivostí větší než Pravostranný interval spolehlivosti Parametr µ je s 95% spolehlivostí menší než Intervalové odhady pro rozptyl σ 2 Oboustranný interval spolehlivosti Parametr σ 2 se s 95% spolehlivostí nalézá v intervalu. Levostranný interval spolehlivosti S 95% spolehlivostí je parametr σ 2 větší než. Pravostranný interval spolehlivosti S 95% spolehlivostí je parametr σ 2 menší než. Intervalové odhady pro směrodatnou odchylku σ Oboustranný interval spolehlivosti Parametr σ se s 95% spolehlivostí nalézá v intervalu. Levostranný interval spolehlivosti S 95% spolehlivostí je parametr σ větší než. Pravostranný interval spolehlivosti S 95% spolehlivostí je parametr σ menší než.
Jednovýběrové testy Zadání.. Základní charakteristiky: n =..., x =..., s =..., α =... H: µ =... A: µ >... (například) x µ 0 Testové kritérium t = n =... s { 1 α } Kritický obor: W = t, t t ( n 1), kde t ( n ) Závěr:. α 1 α 1 je kvantil Studentova rozdělení