2.3 Prezentace statistických dat (statistické vyjadřovací prostředky) Statistika musí výsledky své práce převážně číselná data prezentovat (publikovat, zveřejňovat) jednoduše, srozumitelně a přitom výstižně. Používá k tomu tři základní formy: Slovní popis Tabulky Grafy (a samozřejmě jejich kombinaci) Nevýhodou rozsáhlejší textové prezentace je malá přehlednost, a proto se používá pouze k uvedení malého počtu jednoduchých informací, například v novinách nebo v různých zprávách: Počet našich zákazníků se meziročně k 30.6.2008 zvýšil o 173 tisíc na 5,313 miliónu, sdělila Právu tisková mluvčí T-Mobilu M. Kemrová. T-Mobile si tak v tomto ukazateli nadále udržuje T-Mobile stále jedničkou vedoucí pozici na českém mobilním trhu. Konkurenční Telefónica O 2 měla ke konci června 5,186 miliónů klientů a Český Vodafone 2,75 miliónu aktivních SIM karet. Právo, 8. 8. 2008, str. 17 Uspořádáním číselných údajů o výsledcích statistického zkoumání do logického a systematického přehledu, doprovázeného slovním výkladem, dostáváme statistickou tabulku: SIM karty na českém mobilním trhu k 30. 6. 2008 Operátor počet v miliónech podíl v % Telefónica 0 2 5,186 40,1 T-Mobile 5,313 39,1 Vodafone 2,750 20,8 Celkem 13,249 100,0 Právo, 8. 8. 2008 a vlastní výpočet
Účinným způsobem prezentace statistických dat jsou grafy neboli vizualizace dat. Nejsou tak přesné jako tabulky (možnost odečítat hodnoty z grafů je limitována jejich kvalitou a rozlišením stupnic), ale jsou názornější a lépe poskytnou rychlou představu o důležitých tendencích a souvislostech. Pozor ale, jak uvidíme později grafy mohou i (ať už úmyslně nebo neúmyslně) vyvolávat u čtenářů jiný dojem, než by odpovídal zobrazovanému číselnému materiálu. Grafy mají i významný popularizační efekt. nebo 2.3 Prezentace statistických dat 2
2.3.1 Statistické tabulky Při sestavování statistických tabulek je třeba respektovat určitou ustálenou úpravu, což pak usnadní čtení tabulek a jejich porozumění. Doporučenou úpravu popisuje např. Zpravodaj ČSÚ 5/94. název tabulky poznámka obecná měřící jednotka Infrastruktura silniční dopravy v České republice * ) v km název legendy legenda poznámka zvláštní Typ komunikace Délka komunikace v letech 2000 2006 Silnice 54 909 54 952 v tom I. třídy 6 031 6 174 z toho rychlostní komunikace 299 331 II. třídy 14 688 14 360 III. třídy 34 190 34 118 Dálnice 1) 499 633 Celkem silnice a dálnice 55 408 55 585 z toho evropská silniční síť typu E 2 644 2 599 * ) bez účelových komunikací Zdroj. Statistická ročenka 1) jen v provozu ČR 2007 hlavička Povinnými náležitostmi statistické tabulky jsou název, tabelární část (s hlavičkou, legendou a ostatními políčky) a zdroj (pramen). Případnými náležitostmi pak poznámky a adresace sloupců a řádků. Nad tabulku se umísťuje název tabulky. Začíná velkým písmenem, končí bez tečky. Stručně vyjadřuje obsah tabulky, a to z hlediska věcného, časového a prostorového. Hlavička (první řádek) popisuje obsah sloupců.text hlavičky se píše zpravidla vodorovně, pouze v případě úzkých sloupců a rozsáhlejšího textu se píše svisle zdola nahoru. Text začíná velkým písmenem, případné další členění již písmeny malými. Šířka všech sloupců v tabulce je buď stejná nebo se odvozuje pro každý sloupec od maximálního řádu číselné hodnoty ve sloupci. Legenda (první sloupec) popisuje obsah řádků.text začíná velkým písmenem, případné další členění již malými písmeny. Průsečík sloupce a řádku nazýváme ve statistické tabulce políčkem. 2.3 Prezentace statistických dat 3
První políčko tabulky (průsečík prvního řádku a prvního sloupce) obsahuje většinou název legendy, někdy i hlavičky. Jsou-li údaje v celé tabulce pouze v jedné stejné měřící jednotce, uvede se tato jednotka vedle názvu nebo pod ním. Jsou-li údaje v různých měřících jednotkách, pak se jednotky obvykle uvedou přímo v tabulce. K bližšímu vysvětlení obsahu tabulky slouží poznámky (text v názvu i v samotné tabulce má být co nejstručnější): Obecná poznámka se vztahuje k celé tabulce, označuje se hvězdičkou za názvem tabulky a vysvětluje se vlevo pod tabulkou. Zvláštní poznámky se vztahují k částem tabulky, označují se arabskými číslicemi u vysvětlovaného místa, vysvětlují se pod tabulkou (pod obecnou poznámkou, je-li přítomna). V případě rozsáhlejší tabulky nebo je-li potřeba obsah tabulky metodicky vysvětlit, provádí se adresace sloupců a řádků (podobně jako ve spreadsheetu). Začíná se adresací sloupců malými písmeny latinské abecedy (sloupce, které neobsahují výsledky statistické práce) a pokračuje se arabskými číslicemi od 1 (sloupce, které obsahují výsledky statistické práce). Adresace řádků se provádí arabskými číslicemi od nejbližší další desítky, před níž skončilo číslování sloupců. Zdroj (pramen) uvádí původ obsahu tabulky. Zvyšuje věrohodnost tabulky. Uvádí se pod tabulku od levého okraje (pod případné poznámky) nebo pod tabulku do pravé poloviny (vedle případných poznámek). Zjišťovali-li jsme údaje sami, uvede se Vlastní šetření. Součástí tabulek bývají i součty (součtové řádky či sloupce), které mohou být umístěny: - na konci tabulky. V případě vícestupňových součtů (průběžné sčítání, mezisoučty) se součet I. stupně (součet původních dílčích hodnot) označuje slovem Celkem nebo Součet, součet II. stupně (součet součtů) slovem Úhrnem nebo Úhrn a součet III. stupně (součet úhrnů) slovy Celkovým úhrnem nebo Celkový úhrn. - na začátku tabulky (klade-li se na součty větší důraz než na jednotlivé dílčí údaje). Následuje-li po součtu výčet dílčích údajů, předchází mu výraz: v tom, jde-li o plný (celkový) výčet z toho, jde-li o dílčí (částečný) výčet Přetvořte vzorovou tabulku z předchozí stránky tak, aby začínala součtovým řádkem. Vymyslete příklady statistických tabulek (stačí kostra bez číselných údajů) se součty na začátku (s využitím plného i dílčího výčtu) i konci tabulek (s využitím všech 3 stupňů součtů). Každé políčko statistické tabulky musí být vyplněno (z důvodu zamezení pozdějšího dodatečného vpisování nebo dnes spíše proto, aby čtenář měl jistotu, že v tabulce nejsou žádné údaje vynechány). Pokud políčko statistické tabulky neobsahuje údaj, uvádí se smluvená značka: x (ležatý křížek) údaj je logicky nemožný (nesmyslný). (tečka) údaj je neznámý (není k dispozici) nebo je nevěrohodný - (pomlčka) hodnota je nulová (případ se nevyskytuje, tedy matematická nula) 0 (nula) se pak uvádí tehdy, je-li hodnota menší než polovina zvolené měřící jednotky, po zaokrouhlení tedy nula. 2.3 Prezentace statistických dat 4
Pokud v součtovém řádku nebo sloupci není součet, ale průměr (intenzitní znaky se shrnují ne součtem, ale průměrem), pak je hodnota průměru uzavřena v kulatých závorkách (). Středisko Počet pracovníků Průměrná měsíční mzda [Kč] Svařovna 8 20 276 Obrobna 11 21 487 Vedení 4 25 256 Celkem firma 23 (21 721) Najděte statistické tabulky s x a. v políčku. Pro úplnost: S tabulkami, které jsou zformátovány podle uvedených pravidel, nelze většinou provádět statistickou analýzu ve statistickém výpočetním prostředí. Uvedená pravidla platí pouze pro prezentaci dat. 2.3 Prezentace statistických dat 5