Statstcká šetření a zpracování dat. Vyjadřovací prostředky ve statstce STATISTICKÉ TABULKY Typckým vyjadřovacím prostředkem statstky je číslo formalzovaným nástrojem číselného vyjádření je statstcká tabulka. Prezentační tabulky: prezentace dat, výsledků zpracování a analýzy. Pracovní tabulky: například na jednotlvých lstech v excelu, zaznamenávání zjštěných a dopočítaných hodnot. Tabulky statstckých konstant. Př konstrukc tabulky by se měly dodržet obecně platné zásady vedoucí k maxmální srozumtelnost tabulky, přehlednost, volbou vhodné grafcké úpravy. Základní prvky tabulky jsou uvedeny v tabulce. číslo tabulky legenda políčko Tab. Indexy vzdělanost obyvatel Zlínského kraje a jeho okresů Index vzdělanost k. 3. 200 Index vzdělanost k 26. 3. 20 O k r e s celkové středoškolské vysokoškolské celkové středoškolské vysokoškolské Kroměříž 52,8 4,96 7,78 73,39 54,5 2,48 2 Uherské Hradště 48,45 37,75 7,64 69,9 50,57 2,85 3 Vsetín 55,39 43,62 8,4 78,57 58,07 2,97 4 Zlín 56,49 45,59 9,46 84, 59,05 5,75 Zlínský kraj 54,76 42,45 8,38 77,3 55,73 3,74 Zdroj: Vlastní výpočty pramen název tabulky součtový řádek záhlaví číselné pole řádek sloupec Případné vysvětlvky, poznámky
Statstcká šetření a zpracování dat. Tab. 2 Smluvené značky používané ve statstckých tabulkách Smluvená značka Symbol Použtí ležatá čárka - nulový údaj, žádný případ ležatý křížek vyplnění políčka není logcké nula 0 méně než polovna měrné jednotky tečka. neznámý údaj Zdroj: Mnařík, Popsná statstka, Brno 2008 Prostředí pro tvorbu tabulek: nejlehčí MS Word STATISTICKÉ GRAFY Výhodou je názornost a přehlednost. Základní prvky grafu jsou totožné s prvky tabulky, grafcký obraz je tvořen geometrckým prostředky (body, úsečky, křvky), smluveným prostředky (typy a tloušťky čar, vybarvení ploch) a pomocným prostředky (osy a stupnce). 60,00 40,00 20,00 00,00 80,00 60,00 40,00 20,00 0,00 Jhomoravský kraj - ndex celkové vzdělanost legenda ICV200 ICV20 pomocné grafcké prostředky (osy, stupnce, sť) geometrcké grafcké prostředky smluvené grafcké prostředky (barvy) číslo grafu 3D efekt Obr. Index celkové vzdělanost pro Jhomoravský kraj Zdroj: Vlastní výpočty pramen název grafu Prostředí pro tvorbu grafů: MS Excel Nepřeberné množství grafů, pro nás nejdůležtější hstogram, polygon četnostní, graf kumulatvní četnost, výsečový graf.
Statstcká šetření a zpracování dat. Počet obyvatel města XY Spotřeba jednotlvých značek pva v Brně 60 50 40 30 20 Radegast % Šerák 6% Holba 5% Plzeň 6% 0 0 do 8) <8 28) <28 38) <38 48) <48 58) <58 a více Staropramen 32% Starobrno 30% věková struktura Obr. 2 Hstogram Obr. 3 Výsečový graf Nedostatky grafů: malá přesnost, možnost nechtěného nebo úmyslného matení čtenářů grafů pomocí optckých klamů.
Významné hodnoty varační řady Nejjednodušší metoda statstckého zpracování dat - Třídění vhodné uspořádání zjštěných nebo naměřených hodnot spočívá v rozdělení prvotních statstckých údajů do určtého počtu skupn (tříd, ntervalů) a zjštění četností (počtu jednotek) v těchto skupnách Klasfkace statstckých řad Statstcká řada Časová řada Prostorová řada Věcná řada Slovní Číselná Varační Statstcká řada neuspořádaná (daná pořadím zjšťování, chaotcké) uspořádaná - seřazená - setříděná Původní řada:, x,... 2 x xn Podle velkost: x ( ), x( 2),... x( ),..., x( n ) x,..., kde x x,... x... x n tentokrát ndex souvsí s velkostí hodnot, přčemž ( ) ( 2) ( ) ( ) x = x, x = n x ( ) mn ( ) max a Třídění podle více znaků - vícestupňové soubor je tříděn v postupných krocích, třídění podle každého dalšího znaku je prováděno uvntř tříd, - kombnační soubor je tříděn současně podle více znaků, výsledkem je kombnační tabulka (kontngenční x asocační, korelační) Varační třídění třídící znak
Významné hodnoty varační řady nespojtý vykazuje menší počet obměn, třídí soubor na skupny jednoduché rozdělení četností bodové třídění spojtý velký počet obměn příbuzné obměny se shrnují do společných skupn (tříd, ntervalů) skupnové (ntervalové) rozdělení četností Tabulka rozdělení četností: pro kvaltatvní znak (bodové třídění, výsečový graf) pro dskrétní znak pro spojtý znak Třídění číselných znaků bodové třídění Příklad č. Roztřďte soubor podle členů domácnost: 2, 5, 6, 4, 3,, 2, 3, 3, 4,,, 2, 4, 4, 3, 3, 5, 2,, 3, 4, 2,, 2, 3,, 4, 3, 6, 5, 3, 4,, 2, 3, 2, 2, 3, 4. Tabulka jednoduchého rozdělení četností (Počet členů v domácnost) Hodnoty znaku Absolutní Relatvní četnost Kumulatvní Kumulatvní x četnost p četnost absolutní četnost relatvní n kn kp 2 3 4 5 6 7 9 8 3 2 0,75 0,225 0,275 0,2 0,075 0,05 7 6 27 35 38 40 0,75 0,4 0,675 0,875 0,95 Suma 40 x x Každé rozdělení četností má dva aspekty - aspekt jednečnost neopakovatelnost, - aspekt zákontost. Grafcké zobrazení hůlkový graf (úsečkový). Co lze z uvedeného rozdělení četností vyčíst
Významné hodnoty varační řady Ukazatel Určení Hodnota Počet domácností (rozsah souboru) Počet domácností např. se třem členy Podíl domácností např. se třem členy (v %) Počet domácností např. s nejvýše třem členy Podíl domácností např. s nejvýše třem členy n n 00 p kn = n j = 00 kp = 00 p j = 40 27,5 % 27 67,5 % Třídění číselných znaků skupnové (ntervalové) třídění Třídění probíhá v rámc uměle vytvořených skupn (ntervalů, tříd). Postup př varačním třídění. Hodnoty uspořádat vzestupně 2. Seskupení do ntervalů stejné šířky do 00 prvků do 500 prvků nad 500 prvků 6-9 ntervalů 0-5 ntervalů 6 20 ntervalů nebo odhad počtu ntervalů na základě výrazu: 3. Šířka ntervalu h k = R = R = X k max - X mn (varační rozpětí) 4. Hrance ntervalů musí být vyznačeny jednoznačně, první a poslední nterval může být určen pouze jednou hrancí (otevřený nterval) zachycení extrémních hodnot 5. Třídění (čárkovací metodou) //// /// Střed ntervalu - průměr dolní a horní hrance ntervalu (nezávslý na hodnotách zařazených jednotek), formálně nahrazuje ndvduální hodnoty patřící do určté třídy, reprezentuje úroveň třídy n
Významné hodnoty varační řady Zjstíme absolutní četnost jednotlvých ntervalů n Vypočteme relatvní četnost p Kumulatvní četnost 6. Graf k kn = n n= = n k 00 [%], kde k je počet řádků n n= hstogram četností (sloupkový graf) úsečkový (ve středech ntervalů) polygon četností (spojncový - spojuje vrcholy úsečkového grafu) Po provedeném třídění jsou všechny konkrétní hodnoty patřící do určté třídy zapomenuty a jsou nahrazeny středem třídy x, který reprezentuje úroveň třídy. Úhrn třídy vypočítáme jako součn x. n a nahradíme jím přesnou hodnotu součtu všech hodnot třídy. Příklad č. 2 Proveďte třídění v souboru středně velkých průmyslových podnků podle průměrného počtu zaměstnanců ve sledovaném roce. Sestavte tabulku skupnového rozdělení četnost. Určete významné hodnoty. 28 43 62 76 80 63 47 235 25 38 47 69 29 3 64 0 85 82 27 47 56 44 74 75 7 64 30 45 43 42 44 25 22 48 53 35 39 43 6 48 3 84 9 92 60 7 36 207 86 23 205 67 52 67 55 4 99 63 20 37 82 59 28 64 72 38 49 93 92 6 x mn = 0 x max = 235 Varační rozpětí R = x max - x mn R = 235-0 R = 25
Významné hodnoty varační řady Šířka třídy h = R 25 h = = 20, k 6 83 25 h = = 7,86 20 7 25 h = = 5,63 8 Tabulka ntervalového rozložení četností Třída Vymezení tříd Střed třídy Abs.četnost Kumulat. Relatvní četn. Kumulat. x n méně než 20) 0 4 4 0,05743 0,05743 2 <20,40) 30 5 9 0,24286 0,27429 3 <40,60) 50 9 38 0,27429 0,542857 4 <60,80) 70 7 55 0,242857 0,78574 5 <80,200) 90 66 0,5743 0,942857 6 <200,220) 20 3 69 0,042857 0,98574 7 <220 a více 230 70 0,04286 Celkem X X 70 X X kn p kp
Významné hodnoty varační řady Grafcké zobrazení rozdělení četností (Excel) Hstogram rozdělení četností 20 Počet podnků 5 0 5 0 méně než <20,40)<40,60)<60,80)<80,200)<200,220)<220 a víc 20) Počet zaměstnanců Polygon četností 20 Počet podnků 5 0 5 0 0 30 50 70 90 20 230 Počet zaměstnanců Graf kumulatvních četností Počet podnků 80 70 60 50 40 30 20 0 0 20 40 60 80 200 220 240 Počet zaměstnanců