1. Úvod do studia statistiky Andrew Lang o politikovi: Používá statistiku jako opilý člověk pouliční lampu spíš na podporu než na osvětlení. Benjamin Disraeli o lži: Jsou tri stupně lži - lež, nehanebná lež a statistika. 1.1. Významy pojmu statistika Slovu statistika může být přisuzován nejrůznější obsah, a proto také existuje mnoho definic. Vzniklo z latinského slova status = stav, resp. štát. Nejstarší statistikou je popis státu, spočívající v zobrazení daného zeměpisného, hospodářského a politického stavu. V současné době pohlížíme na statistiku ze dvou přístupů. Jednak jde o praktickou činnost, tj. evidenční a statistickou praxi, jednak o vědu, která se zabývá zkoumáním hromadných jevů. Statistika jako praktická činnost statistická administrativa statistická evidence ( např. sběr údajů, tříděni, sumarizace apod.), instituce, která tuto evidenci vykonává (např.. ČSÚ, ministerstva aj.), úhrn údajů o nějaké skutečnosti (statistika nezaměstnanosti atd.) Realizuje prostřednictvím statistického výkaznictví. Těžiště je v soustavě orgánů státní statistiky, která je vytvořena na územním principu a je řízena Českým statistickým úřadem (ČSÚ) se sídlem v Praze. Státní statistické orgány poskytují informace potřebné pro posuzování úrovně sociálního a ekonomického vývoje na příslušné úrovni územní hierarchie a realizují různá další statistická šetření. Statistika jako vědecká disciplína teorie statistiky Statistická věda je disciplínou zabývající se zkoumáním hromadných společenských jevů a procesů, může jít však i o jevy biologické a technické. I když statistika zkoumá kvantitativní stránku těchto jevů, nesmí být opomíjena stránka kvalitativní. Základním vyjadřovacím prostředkem je číslo. Statistika, chápaná jako vědecká disciplína, má dvě specifické části, a to ekonomickou statistiku a obecnou teorii statistiky (statistické metody): ekonomická statistika - zkoumá kvantitativní stránku národního hospodářství a podle dílčí působnosti se člení na dílčí složky (např. statistika průmyslu, zemědělství, obchodu, obyvatelstva ap.) obecná teorie statistiky - definuje statistické pojmy a prezentuje obecně platné metody pro kvantitativní zkoumání hromadných jevů. Jde o metody Získávání dat statistických údajů, metody jejich zpracování, metody statisticko ekonomické (biologické, technické) analýzy a formy sdělování výsledků. Ekonomická teorie statistiky v podstatě poskytuje metodiku pro ten který účel 1
zkoumání v rámci řešeného problému ekonomické statistiky. Mohou to být například: popisná statistika - výsledky není možné zevšeobecnit, matematická (induktivní) statistika cílem je zevšeobecnit výsledky (odhad a testování hypotéz) použiti počtu pravděpodobnosti, teorie výběrových zjišťovaní, aplikované vědy ( metrie a -grafie ): biometrie, dendrometrie, ekonometrie, chemometrie atd. vědy se silným statistickým základem: sociologie, psychologie, demografie. 1.2. Co je typické pro statistiku Zkoumá hromadné jevy. Zabývá se proměnlivými variabilními vlastnostmi. Pracuje s čísly a vyjadřuje se pomocí čísel zajímá se především o kvantitativní stránku reality. Používá výpočtovou techniku na vytváření a správu statistických databází, na hromadné zpracování a analýzu dát a na komunikaci. 1.3. Co umí a neumí statistika Statistika řeší úlohy různého stupně složitosti, počínajíc Získávání datm (počet domácností, počet pracovníků v odvětví XY, objem vývozu ), přes popis struktury (věková struktura obyvatelů, struktura firem z hlediska právní formy podnikání, vyčíslování dílčích ukazatelů v čase a prostoru (výpočet průměrné mzdy v NH, výpočet cenové hladiny spotřebitelských cen), porovnávaní takto agregovaných ukazovatelů v čase anebo prostoru (trend vývoje mezd, změna hladiny spotřebitelských cen), předpovídání jejich budoucí úrovně (tržby v maloobchode v budoucím čtvrtroku, vývoz produktu AB v budoucím roku), měření závislosti (závislost mezd na HDP, závislost vývozu na kurzu koruny). To vše buď na popisné nebo induktivní úrovni. Statistika selhává, pokud nemá k dispozici adekvátní číselné údaje, když chybí představa o velkosti chyb měřeni a vplyvu různých průvodních činitelů, když není je k dispozici dostatečně rozsáhlý soubor případů anebo v datech chybí proměnlivost (variabilita). 2
1.4. Statistický projekt Obecné schéma vedeckého projektu Každý výzkumný a statistický projekt nevyjímaje lze popsat pomocí jednotlivých, na sebe navazujících činností, uvedených na vedlejším obrázku. Statistika může přispět k řešení výzkumného projektu prakticky v každém kroku. Hlavními úkoly při plánování a návrhu výzkumného projektu jsou přesná formulace cíle a účelu výzkumu a vymezení pojmů a metod pro studované statistické jenotky, sledované znaky, sběr dat, statistickou analýzu a technické zpracování dat. Příklad: Lékař zformuluje problém, který podle jeho názoru vyžaduje další výzkum. Je samozřejmé, že se má dobře seznámit s výsledky dřívějšího výzkumu v této oblasti a že má v hrubých rysech formulovat cíl a účel výzkumu. Cíl : Vytipovat osoby, které se snadno mohou nakazit chřipkou. Účel : Provést preventivní opatření. Cíl : Získat poznatky o účincích dvou léků užívaných při léčbě choroby. Účel : Použít lepší z obou léků. Cíl : Zjistit příčiny vysoké dětské úmrtnosti v dané oblasti. Účel : Provést potřebná zdravotnická opatření. Při vytváření přesné formulace cílů výzkumu, kdy se předpokládá užití statistických metod, je vhodné zahájit spolupráci příslušného odborníka a erudovaného statistika už na samém počátku plánování a návrhu výzkumného projektu. Statistik má být obeznámen s nejdůležitějšími aspekty problému z lékařské stránky a lékař musí získat základní statistické znalosti. Společně pak formulují cíle ve tvaru hypotéz, které mají být kriticky prověřeny pomocí dat. 3
Zásadní chybou je vytvářet hypotézy až podle druhu nashromážděných dat a na stejných datech je prověřovat. Většinou již při formulaci cíle a účelu výzkumu přesně vymezujeme statistické jednotky (místně, časově, věcně), kterých se výzkum týká. V mnoha výzkumných projektech musíme počítat s tím, že nemůžeme studovat celou populaci 1, která nás zajímá. V této fázi rovněž rozhodujeme, zda prováděné statistické šetření bude úplné, nebo výběrové. V případě výběrového šetření stanovíme metodu výběru a odhadneme potřebný rozsah výběru. Zvolená metoda výběru předurčuje kvalitu prováděných závěrů. Nežádoucí jsou takové metody, které vedou k vytváření selektivních výběrů, např. výběr respondentů podle jejich momentální dostupnosti. Každý sledovaný znak statistické jednotky musí být přesně a jednoznačně určen. Například pro znak "měsíční příjem" musíme udat, zda sledovaná osoba má uvést hrubý, nebo čistý měsíční příjem, a to z vlastního výdělku, nebo jako průměrný výdělek připadající na jednoho člena rodiny. Dále je třeba určit typ sledovaných znaků. Zda jsou kvalitativní (slovní) nebo kvantitativní (číselné) a zvolit stupnici měření. Volba měrných stupnic ovlivňuje množství informace obsažené v údajích a má rozhodující význam i pro použité metody statistického zpracování. 1 Populací se ve statistice nazývají jakékoliv úplné soubory zkoumaných statistických jednotek 4
Schéma statistického projektu Statistický problém Statistická jednotka Statistické otázky Statistické znaky Získávání dat (měření, pozorování, dotazování) Rešení statistických otázek Prezentace výsledků Interpretace výsledků Odpověď na štat. otázky 5
1.5. Statistický problém, jednotka a statistické otázky Formulace statistického problému většinou navazuje na problémy společenské praxe (ekonomické, sociální, ad.) řešené v rámci různých vědeckých studií a zadání. Bývá proto formulovaný ze širšího hlediska a všeobecněji. Statistické otázky a odpovědi na ně slouží na vysvětlení nebo vyřešení statistického problému. Příklad: Statistický problém: Statistické otázky: Úspěšnost (neúspěšnost) studentů na vysoké škole. Statistická jednotka: Student Vývoj prospěchu studentů podle studijních programů a ročníků studia? Statistický znak: prospěch, studijní program, ročník studia Počty a podíl studentů odcházejících ze studia v jednotlivých ročnících studia? Statistický znak: Rozdělení studentů odcházejících ze studia podle důvodů odchodu? Statistický znak: Počty studentů odcházejících ze studia v závislosti na absolvované střední škole? Statistický znak: 6
Tabulky Třída 1. 2. 3. 4. 5. 6. Klasifikace A B C D E F 1.1. Příklady statistik Rozdělení studentů podle klasifikace (Tabulka rozdělení četností) Počet Podíl studentů studentů podle podle klasifikace [%] klasifikace 18 21 29 37 50 24 10,1 11,7 16,2 20,7 27,9 13,4 Součtový počet studentů podle klasifikace 18 39 68 105 155 179 Tab. 1.6. Součtový podíl studentů podle klasifikace [%] 10,1 21,8 38,0 58,7 86,6 100,0 Součet 179 100,0 Grafika P o č e t s t u d e n t ů 60 50 40 30 20 10 0 A B C D E F Klasifikace studentů Obr. 1.6 Rozdělení studentů podle klasifikace Sloupcový diagram (pseudo 3D) Experiment výnos plodiny výnos plodiny zasáhly rušivé činitele: bonita půdy klimatické podmínky čára vystihuje závislost výnosu na hnojení všichni hnojili přibližně stejně dávka hnojiva řízená experimentátorem 7 dávka hnojiva udaná pěstitelem