Elemetárí zpracováí statistického souboru Obsah kapitoly 4. Elemetárí statistické zpracováí - parametrizace vhodými empirickými parametry Studijí cíle Naučit se výsledky měřeí parametrizovat vhodými empirickými parametry. Doba potřebá ke studiu Základí tet 1 hod. Příklady také 1 hod. Pojmy k zapamatováí Úvod Empirické parametry: Parametr polohy, variability, šikmosti a špičatosti Mometové parametry Aritmetický průměr Rozptyl a směrodatá odchylka Budeme dále pokračovat ve zpracováváí výsledků měřeí, kdy jsme v akademickém roce 008 09 zkoumali výšku studetek Vysoké školy fiačí a správí. Výkladová část 4. Elemetárí statistické zpracováí Výsledky měřeí je potřebé uspořádat do tabulky, graficky vyjádřit pomocí polygou (to už jsme udělali v miulém tématu) a parametrizovat vhodými empirickými parametry (z řeckého slova empirie - zkušeost). Tedy parametry vypočítaými z aměřeých hodot (tím se budeme zabývat yí). Výsledkem elemetárího statistického zpracováí je empirický obraz zkoumaého výběrového statistického souboru VSS. Empirické parametry stručě a jedoduše vystihují povahu zkoumaého statistického souboru. VSS - výběrové parametry Empirické parametry lze dělit podle toho, který rys zkoumaého statistického souboru vystihují: - parametry polohy, - parametry promělivosti (variability), - parametry šikmosti, - parametry špičatosti.
Polohou empirického rozděleí četostí je myšleo jeho umístěí a vodorové ose souřadicového systému. Pomocí aritmetického průměru lze výstižě charakterizovat parametr polohy. Vypočteme ho jako součet všech hodot děleý počtem hodot. Aritmetický průměr začíme. i = 1 zak i 1 je zápis součtu hodot přes všecha i od 1 do. V ašem příkladu můžeme aritmetický průměr vypočítat z tabulky, v íž máme zazameáy výšky studetek. č. pořadí výška 89 1 151 34 157 51 3 158 94 4 158 3 5 160 41 6 161 83 7 16 31 8 163 81 9 163 4 10 164 33 11 164 37 1 164 87 13 164 88 14 164 7 15 165 3 16 165 39 17 165 84 18 165 96 19 165 49 0 166 44 1 167 91 167 48 3 167 90 4 167 1 5 168 45 6 168 40 7 168 8 8 168 9 9 168
95 30 170 31 170 85 3 170 35 33 170 80 34 170 50 35 171 36 36 17 6 37 173 38 173 47 39 173 38 40 175 43 41 176 93 4 176 86 43 176 4 44 177 5 45 180 97 185 151+ 157 +... + 180 + 185 = = 167, 587cm. Pokud je každá hodota zastoupea pouze jedou, mluvíme o prostém aritmetickém průměru. Jelikož my už máme výšky že roztříděé do tabulky, můžeme k výpočtu s výhodou použít vážeý aritmetický průměr, kde vahami jsou počty že v jedotlivých výškových kategoriích. Jejich výšku bychom měli v každé kategorii zprůměrovat, ale to by ám práci ijak eusadilo. Za výšku budeme tedy brát střed itervalu. U krajích itervalů uvažujeme, jako by škála pokračovala. i. i = 1 Iterval střed itervalu i i do 157 155 1 158-16 160 5 163-167 165 3 17 168-17 170 4 1 173-177 175 5 8 178 a více 180 6
V ašem příkladu 155 + 5 160 + 17 165 + 1 170 + 8 175 + 180 7715 = = = =167,7174cm Jak vysvětlíte, že výpočet pomocí prostého (167,587cm) a vážeého (167,7174cm) aritmetického průměru se maliko liší? (V případě vážeého aritmetického průměru jsme za výšku brali střed itervalu, ikoliv aritmetický průměr všech výšek v daém itervalu. Tím došlo k drobému zkresleí.) Porováím výšky každé žey s aritmetickým průměrem obdržíme empirický parametr variability, kterému říkáme rozptyl. Začíme jej S a vypočítáme S = 1 ( ) i. Rozdíly od aritmetického průměru umocňujeme a druhou, aby se ám avzájem eodečetla kladá a záporá čísla. V ašem příkladu bychom postupovali ásledově: Prostý aritmetický průměr zaokrouhlíme a jedou desetiu = 167,6 cm. ( 151 167,6) + (157 167,6) +... + (180 167,6) + (185 167,6) S = S = 39,396. Pokud jste teto výpočet prováděli, zjistili jste, že je dost pracý. S výhodou můžeme opět použít data setříděá do tabulky, potom S vypočítáme podle vztahu S = 1 i ( ) i. Iterval střed itervalu i i do 157 155 1
158-16 160 5 163-167 165 3 17 168-17 170 4 1 173-177 175 5 8 178 a více 180 6 Použijeme vážeý aritmetický průměr také zaokrouhleý a jedu desetiu = 167,7 cm. S ( 155 167,7) + 5 (160 167,7) + 17 (165 167,7) + 1 (170 = S = 33,3770. Opět se rozptyly vypočítaé ze tříděých a etříděých hodot maliko liší. Jaká je iterpretace tohoto čísla? Protože jsme sčítali druhé mociy, tak je iterpretace obtížá. Proto počítáme odmociu z rozptylu S = S. Teto parametr azýváme směrodatá odchylka. S = 5,78 cm. Směrodatá odchylka ukazuje, jakou výpovědí hodotu má aritmetický průměr. Je-li směrodatá odchylka velká, výpovědí hodota aritmetického průměru je malá a opačě. Rozšiřující tet Geometrický průměr Prostý geometrický průměr kladých hodot 1,,...,, které opět emusí být uspořádáy, vypočteme jako G = 1 = i i = 1 L, kde řecké písmeo Π představuje symbol používaý pro souči hodot. Harmoický průměr
Prostý harmoický průměr kladých hodot 1,,...,, které emusí být uspořádáy, lze vypočítat jako H = 1 1i. Převráceá hodota harmoického průměru 1 H i 1 = = 1 i je aritmetickým průměrem převráceých hodot proměé. Kvadratický průměr Prostý kvadratický průměr hodot 1,,...,, které opět emusí být uspořádáy, vypočteme jako K = i 1. Pro kladé hodoty 1,,..., platí mezi uvedeými typy průměrů těchto hodot relace erovosti H G K. Zaméko rovosti platí pouze v případě, jestliže jsou všechy hodoty číselé proměé ve statistickém souboru stejé. Shrutí Kotrolí otázky a úkoly Empirická data jsme dále zpracovávali. Vypočítali jsme prví dva empirické parametry zkoumaého souboru. Parametr polohy jsme charakterizovali pomocí aritmetického průměru a parametr variability pomocí rozptylu, resp. směrodaté odchylky. 1) V tabulce jsou údaje o měsíčích výdajích 30-ti domácostí v Kč Iterval Střed itervalu i 1500-1999 1750 4 000-499 50 6 500-999 750 7 3000-3499 350 7 3500-3999 3750 4 4000-4500 450 30
Vypočtěte parametr polohy (aritmetický průměr) a variability (rozptyl, resp. směrodatou odchylku). ) V tabulce jsou údaje o počtu čleů 30-ti domácostí i i 1 6 3 4 4 10 5 5 6 3 30 Vypočtěte parametr polohy (aritmetický průměr) a variability (rozptyl, resp. směrodatou odchylku). Sezam použitých zkratek Studijí literatura Odkazy HNJ - Hromadý áhodý jev SS - Statický soubor SJ - Statistická jedotka SZ - Statistický zak HSZ - Hodota statistického zaku ZSS - Základí statistický soubor NV - Náhodý výběr VSS - Výběrový statistický soubor Bílková, D. Budiský, P. Voháka, V.: Pravděpodobost a statistika. Aleš Čeěk, Plzeň, 009. Cyhelský, L. Souček, E.: Základy statistiky. EUPRESS, Praha 009. Hidls, R. Hroová, S. Seger, J.: Statistika pro ekoomy. Professioal Publishig, Praha 004. Český statistický úřad - http://www.czso.cz/ Klíč k úkolům 1) Průměré měsíčí výdaje domácostí a potraviy jsou.866,70kč Směrodatá odchylka S měsíčích výdajů domácostí a potraviy je 715,11Kč. ) = 3,63 Průměrý počet čleů domácosti je mezi 3 až 4 čleové.
Směrodatá odchylka je 1,4 člea domácosti.