Přednáška 1/ 1 Úvod do studia statistiky 1. Významy pojmu statistika Co o ní asi všichni víme Statistika je přesný součet nepřesných čísel Statistika nuda je, má však cenné údaje Věřím jen těm statistikám, které jsem si zfalšoval sám a jaká je realita: Statistika jako praktická činnost statistická administrativa statistická evidence ( např. sběr údajů, třídění, shrnování, apod.), instituce, která tuto evidenci provádí (např. ČSÚ, ministerstva, aj.), souhrn faktografických údajů o nějaké skutečnosti (statistika nezaměstnanosti, zahraničního obchodu, pohybu obyvatelstva atd.), je upravena zákonem č. 89/1995 O státní statistické službě a mnoha dalšími předpisy, opírá se o klasifikace, číselníky a registry, slouží státu, resortu, instituci, firmě Provádí šetření formou výkaznictví, soupisů, dotazníkových šetření apod. Těžiště je ve zjišťování faktografických údajů, jednoduchém zpracování a prezentaci výsledků. V omezené míře jsou používány jednoduché analytické nástroje (např. stanovení struktury jevu pomocí třídění, shrnování (součtem, průměrem, agregací), prostorové a časové srovnávání, apod.). V případě použití výběrových zjišťování jsou využívány poznatky teorie výběrových zjišťování (viz dále). Navzájem se ovlivňují a doplňují Statistika jako vědní disciplína teorie statistiky popisná statistika výsledky statistické analýzy se týkají jen prošetřených případů a nelze je zobecnit, matematická (induktivní) statistika cílem je zobecnit výsledky (používané úlohy jsou odhady a testování hypotéz) použití počtu pravděpodobnosti, teorie výběrových zjišťování vytváření reprezentativních vzorků výběrů z populací zákazníků, voličů, obcí, firem, atd. aplikované vědy ( metrie a -grafie ): biometrie, dendrometrie, ekonometrie, sociometrie, psychometrie, demografie 2. Co je typické pro statistiku Zkoumá hromadné jevy. Zabývá se proměnlivými variabilními vlastnostmi. Pracuje s čísly a vyjadřuje se pomocí čísel zajímá se především o kvantitativní stránku reality. Používá výpočetní techniku k vytváření a správě statistických databází, k provádění hromadného zpracování a analýzy dat a ke komunikaci.
Přednáška 1/ 2 3. Co umí a neumí statistika Některé typické statistické úlohy různého stupně složitosti: popis struktury hromadného jevu (věková struktura obyvatel ČR, struktura domácností z hlediska sociálních skupin, struktura firem zvoleného odvětví z hlediska právní formy podnikání), shrnování dílčích ukazatelů v čase a prostoru (výpočet úhrnného maloobchodního obratu, výpočet průměrné mzdy v NH ČR, výpočet cenové hladiny spotřebitelských cen v ČR), srovnávání takto agregovaných ukazatelů v čase nebo prostoru (dynamika mezd, dynamika hladiny spotřebitelských cen, srovnání míry nezaměstnanosti v několika regionech), předvídání jejich budoucí úrovně (tržby v maloobchodě v příštím čtvrtletí, vývoz produktu AB v příštím roce), měření závislostí (závislost mezd na HDP, závislost vývozu na kurzu koruny, závislost preferencí na vzdělání voličů). To vše buď na popisné nebo induktivní úrovni. Každá úloha má svoji stránku praktickou, teoretickou a výpočetní. Kdy statistika mlčí : chybí-li představa o velikosti chyb zjištěných údajů a míře vlivu rušivých faktorů, nemá-li k dispozici dostatečně rozsáhlý a reprezentativní soubor případů, není-li v datech přítomna proměnlivost (variabilita). 4. Etapy statistické činnosti zjišťování shromáždění a zaznamenání údajů, jejich verifikace a kontrola, zpracování uspořádání v databázi, seskupování: třídění, shrnování: sumarizace, průměrování, agregace, analýza výpočet charakteristik, měření závislostí, časové či prostorové srovnávání, měření dynamiky, prezentace výsledků tabulkové či grafické vyjádření a slovní zhodnocení výsledků předcházejících etap.
Přednáška 1/ 3 5. Základní principy statistických zjišťování Podle úplnosti zjišťování Úplná zjišťování Zahrnují všechny existující případy v populaci Vedou k přesným výsledkům Prakticky těžko proveditelná Neúplná zjišťování Pracují se vzorkem případů Vedou nejvýše k odhadům výsledků Prakticky snadno proveditelná Reprezentativní (výběrová) Exaktní metoda tvorby vzorku - výběru Poskytuje zobecnitelné poznatky Nereprezentativní (ostatní) Neexaktní metody tvorby vzorku Neposkytuje zobecnitelné poznatky V běžné praxi dosti používaná Úsudkový (záměrný výběr) Omezeně zobecnitelné poznatky Pravděpodobnostní (náhodný) výběr Zcela zobecnitelné poznatky Anketa Metoda základního masívu Samovolný (spontánní) výběr Namátkový výběr aj. Nepřekonatelnou metodou výběrového zjišťování je pravděpodobnostní (náhodný) výběr.
Přednáška 1/ 4 Podle podmínek zjišťování Prosté pozorování Monitorování skutečnosti Obtížná eliminace vlivu rušivých faktorů Žádná kontrola ovlivňujících faktorů Řízený experiment Vytvoření umělé "reality" Eliminace vlivu rušivých faktorů Řízení úrovně ovlivňujících faktorů V oblasti sociálně ekonomických jevů je typickou metodou zjišťování prosté pozorování. Proč jsou údaje z řízeného experimentu kvalitnější? výnos plodiny výnos plodiny zasáhly rušivé činitele čára vystihuje závislost výnosu na hnojení všichni hnojili přibližně stejně dávka hnojiva řízená experimentátorem dávka hnojiva udaná pěstitelem
Přednáška 1/ 5 MS EXCEL jako nástroj pro statistickou analýzu dat Možnosti statistické analýzy v MS Excelu: vlastní pracovní tabulka + vlastní vzorce, event. makra (prakticky neomezené možnosti), použití statistických funkcí (80 funkcí s výsledkem ve tvaru skaláru, vektoru nebo matice), použití doplňku Analýza dat (19 procedur s výsledky uspořádanými v přehledných tabulkách viz příklad), vlastní nebo získané doplňky v jazyce Visual Basic (neomezené možnosti), grafy (14 základních typů grafů v celé řadě modifikací).
Přednáška 1/ 6 UNISTAT pro Windows statistické výpočetní prostředí Možnosti statistické analýzy v prostředí UNISTAT pro Windows: více než 100 statistických procedur, několik desítek grafů ve formátu *.bmp, *wmf, *jpg, výměna dat v celé řadě formátů (*.xls, *.doc, *.dbf, *.mdb, *.wk?, *.txt aj.), přímý výstup výsledků do Wordu, Excelu, PowerPointu, Exporeru apod., možnost provozovat jako doplněk MS Excelu, aktuální jazykové prostředí (čeština, slovenština, angličtina) volí uživatel, snadná obsluha a nízká cena. Další statistický software pro profesionální použití: SPSS pro sociology, psychology, marketing aj., kromě běžné statistiky řada velmi specializovaných modulů, vlastní jazyk, vlastní textový procesor, STATGRAPHICS byl pro většinu Čechů prvním statistickým programem pro PC, SAS pro biology, lékaře, zemědělce extrémně rozsáhlý a náročný na obsluhu, SPlus určený původně pro rozvoj statistických metod, má vlastní programovací jazyk, teprve poslední verze umožňují nabídkový režim, STATISTICA relativně nejpřístupnější, umožňuje řešit např. problematiku řízení kvality a několik desítek jiných Jsou většinou podstatně rozsáhlejší, dražší, některé vyžadují speciálně zaškolenou obsluhu, ale hlavně dokonalou znalost statistických metod a jejich záludností.