Úvodní statistické pojmy

Podobné dokumenty
2. Statistická terminologie a vyjadřovací prostředky Statistická terminologie. Statistická jednotka

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Úvod do studia statistiky. 1. Významy pojmu statistika

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

2.5 STATISTISKÉ ZJIŠŤOVÁNÍ, ZÁKLADNÍ STATISTICKÉ POJMY

Sázíte-li v loterii, je to hazard. Hrajete-li poker, je to zábava. Obchodujete-li na burze, je to ekonomie. Vidíte ten rozdíl?

MĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL

Pojem a úkoly statistiky

Popisná statistika - úvod

Základy biostatistiky

Statistika I (KMI/PSTAT)

7. Rozdělení pravděpodobnosti ve statistice

Renáta Bednárová STATISTIKA PRO EKONOMY

Tomáš Karel LS 2012/2013

Statistická šetření - PROČ? Žádná věda není skutečnou vědou, není-li podložena matematickými principy. (L.da Vinci)

Základy popisné statistiky

STATISTIKA 1. RNDr. K. Hrach, Ph.D. Zápočet: 75% docházka na cvičení. + odevzdání seminární práce (úkoly na PC)

STATISTIKA jako vědní obor

METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Statistika. Klíčové kompetence V rámci výuky statistiky jsou naplňovány tyto klíčové kompetence: řešení problémů, komunikativní,

Základy teorie pravděpodobnosti

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

VÝBĚR A JEHO REPREZENTATIVNOST

PROHLOUBENÍ NABÍDKY DALŠÍHO VZDĚLÁVÁNÍ NA VŠPJ A SVOŠS V JIHLAVĚ

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

1. Statistická analýza dat Jak vznikají informace Rozložení dat

Z HISTORIE STATISTIKY

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Analýza dat na PC I.

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Tomáš Karel LS 2012/2013

1 Statistická data a jejich prezentace 1.1 Co je to statistika

23. Matematická statistika

Statistika pro geografy

Diskrétní náhodná veličina

Škály podle informace v datech:

STATISTICKÝ SOUBOR. je množina sledovaných objektů - statistických jednotek, které mají z hlediska statistického zkoumání společné vlastnosti

Základy popisné statistiky

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

VYHODNOCOVÁNÍ KVANTITATIVNÍCH DAT (ÚVOD DO PROBLEMATIKY) Metodologie pro ISK

Pravděpodobnost a statistika

Pro zvládnutí této kapitoly budete potřebovat 4-5 hodin studia.

Proces marketingového výzkumu - jednotlivé fáze, význam, stručná charakteristika. Výběr a formulace výzkumného problému. Vztahy mezi proměnnými.

Náhodné (statistické) chyby přímých měření

Manažerská ekonomika KM IT

Číselné charakteristiky

Technická univerzita v Liberci

Teorie pravěpodobnosti 1

Sociologický výzkum (stručný úvod) Michal Peliš

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA

STATISTIKA 1. RNDr. K. Hrach, Ph.D. Zápočet: odevzdání seminární práce (úkoly na PC) Zkouška: písemná (bez kalkulačky, bez vzorců)

METODY VÝZKUMU GENDEROVÉ PROBLEMATIKY

Tomáš Karel LS 2012/2013

Základní pojmy a cíle statistiky 1

MODERNÍ MARKETINGOVÝ VÝZKUM

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Třídění statistických dat

4EK211 Základy ekonometrie

Popisná statistika. Statistika pro sociology

Mnohorozměrná statistická data

Mnohorozměrná statistická data

Fyzikální veličiny. - Obecně - Fyzikální veličiny - Zápis fyzikální veličiny - Rozměr fyzikální veličiny. Obecně

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

Návod na vypracování semestrálního projektu

Tabulka 1. Výběr z datové tabulky

Náhodné chyby přímých měření

Teorie měření a regulace

STATISTIKA S EXCELEM. Martina Litschmannová MODAM,

Tomáš Karel LS 2012/2013

Od teorie k empirickému výzkumu, konceptualizace, operacionalizace, výběr případů. Strategie a metodologie sociálněvědního výzkumu

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

GEN104 Koncipování empirického výzkumu

4. Zpracování číselných dat

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

Reálné gymnázium a základní škola města Prostějova Školní vzdělávací program pro ZV Ruku v ruce

Téma číslo 4 Základy zkoumání v pedagogice I. Pavel Doulík, Úvod do pedagogiky

STATISTIKA LS Garant předmětu: Ing. Martina Litschmannová, Ph.D. Přednášející: Ing. Martina Litschmannová, Ph.D.

Určeno studentům středního vzdělávání s maturitní zkouškou, předmět: Marketing a management, téma: Marketingový výzkum

Demografie V. Sňatečnost a rozvodovost

Marketing Marketingový výzkum

Design of Experiment (DOE) Petr Misák. Brno 2017

MO-ME-N-T MOderní MEtody s Novými Technologiemi

Úvodem Dříve les než stromy 3 Operace s maticemi

Téma číslo 5 Základy zkoumání v pedagogice II (metody) Pavel Doulík, Úvod do pedagogiky

2 MATEMATIKA A JEJÍ APLIKACE UČEBNÍ OSNOVY

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek

Projekt výzkumu v graduační práci

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

Zápočtová práce STATISTIKA I

TECHNICKÁ UNIVERZITA V LIBERCI

Transkript:

Úvodní statistické pojmy STATISTIKA Statistika vznikla z úředních zjišťování (počtu lidí a jejich majetku), univerzitní státovědy, politické aritmetiky (zkoumání společenských jevů na podkladě objektivních převážně číselných záznamů) a teorie pravděpodobnosti. Zdokonalování zjišťování do podoby dnešního Sčítání lidu. Co je to statistika Praktická činnost činnost, spočívající ve zjišťování, shromaždování, zpracování a prezentaci dat; samotný vyplněný dotazník nebo statistický výkaz (výsledky uvedené činnosti); specializovaná instituce, organizace, pověřena praktickou statistickou činností (v ČR Český statistický úřad). Věda (teorie statistiky, statistické metody) provedení statistické analýzy předpokládá znalost statistických postupů a metod (vlastní matematický aparát). Popisná statistika nejjednodušší disciplína, pouhý statistický popis určité reality. Teorie výběrových zjišťování řešení zjišťování u velkého množství podniků. Matematická statistika konstrukce statistických odhadů, testování hypotéz. Teorie výběrových zjišťování a matematická statistika využívají (na rozdíl od popisné statistiky) teorii pravděpodobnosti, která jim umožňuje kvalifikovaně se vyslovit k hlubší podstatě zkoumaných jevů. Výpočetní statistika programové řešení náročných statistických algoritmů na počítačích. Základní statistické pojmy Typické pro statistiku jsou hromadné jevy, což jsou jevy vyznačující se opakovatelností a masovým výskytem, tedy takové, u kterých lze poměrně snadno shromáždit velký počet případů, pozorování. Vlastním smyslem statistiky je zobecňovat zákonitosti jevů na základě pozorování velkých objemů dat. Statistika se nezajímá o jednotlivé, neopakovatelné, výjimečné jevy a události. Statistika se zajímá především o proměnlivé, variabilní vlastnosti hromadných jevů. Proměnlivost jednotlivých zkoumaných případů je žádoucí, pozor na hrubé chyby.

Úvodní statistické pojmy Statistika se vyznačuje číselným kvantitativním vyjádřením zkoumané reality. Základním vyjadřovacím prostředkem je tedy číslo. Slovní komentář má jen vysvětlující význam. Současná statistika je nemyslitelná bez použití výpočetní techniky. Datové editory (uchování dat), internet (informace), statistické výpočetní systémy STATGRAPHICS, UNISTAT, SPSS, STATISTICA, SAS. Výuka statistiky tabulkové procesory MS Excel (základní statistické funkce). Doplněk pro statistickou analýzu dat. STATISTICKÁ JEDNOTKA je nositelem statistické informace. Základní prvek hromadného jevu. Široký pojem z hlediska rozmanitosti jejích druhů: reálně existující objekty a živé bytosti (lidé, živočichové, rostliny, výrobky), části přírodního nebo společenského prostředí (obce, regiony, státy, podniky), přírodní a společenské jevy a události (narození, úmrtí, požáry, povodně). a z hlediska rozlišovací úrovně: relativně malá jednotka rostlina, zvíře, zaměstnanec x velká porost na pozemku, stádo zvířat, zemědělské podniky. Mnohastupňová hierarchie vymezení statistických jednotek: student studijní skupina ročník obor fakulta univerzita. Specifický problém: - vzorky odebírané ze spojitého prostředí vzorek vody z rybníka, vzorek zrn ječmene z jednoho pytle nelze vybrat tutéž jednotku vícekrát za sebou; - zjišťování je spojeno s destrukcí jednotky rozemletí zrn, usmrcení zvířete, vypití vzorku. Statistická jednotka je vymezena z hlediska věcného (KDO, CO), prostorového (KDE) a časového (KDY). STATISTICKÝ SOUBOR tvoří množinu všech statistických jednotek, na nichž je prováděno statistické zjišťování, a které tvoří hromadný jev. Může být vymezen explicitně (přímý seznam statistických jednotek) nebo implicitně (nepřímé vymezení, výčet vlastností statistických jednotek). Počet statistických jednotek rozsah souboru (n; N).

Úvodní statistické pojmy Vyčerpávající zjišťování (základní soubor, populace) x nevyčerpávající zjišťování (výběrový soubor) výběrové (reprezentativní) x nereprezentativní zjišťování. Malé soubory (pivovary v ČR), velké soubory (skot v ČR), nekonečně rozsáhlé soubory (zrnka ječmene na jednom poli). STATISTICKÉ ZNAKY vlastnosti, jejichž nositeli jsou statistické jednotky, mohou být předmětem statistického zkoumání. Mírou dané vlastnosti z každé jednotky souboru je hodnota (slovní nebo číselná) daného znaku. Počet hodnot jednoho statistického znaku je roven rozsahu souboru. Každá jednotlivá hodnota lze nazvat pozorováním. STATISTICKÉ ZNAKY Společné Číselné Slovní Proměnlivé Měřitelné Spojité Diskrétní Pořadové Alternativní Množné Společné (identifikační) znaky: rozhodují o příslušnosti statistické jednotky k určitému statistickému souboru, nejsou předmětem statistického zpracování, identifikují statistickou jednotku ze tří hledisek věcného, časového a prostorového. Časové (jsou dány časem vzniku nebo existence statistické jednotky), prostorové (jsou dány územím, na němž statistické jednotky vznikly nebo existují), věcné (charakterizují nejrůznější věcné vlastnosti statistických jednotek). Proměnlivé (variabilní) znaky: jsou předmětem zkoumání (HDP, výše průměrné mzdy, procento nezaměstnanosti), nabývají v daném statistickém souboru více než jedné varianty.

Klasifikace variabilních znaků: Úvodní statistické pojmy Číselné (kvantitativní) znaky: Měřitelné (kardinální) znaky: hodnoty jsou výsledkem měření (hmotnost, čas), vyjadřují velikost měřených vlastností statistických jednotek, jsou definovány rozdíly jednotlivých hodnot. Pořadové (ordinální) znaky: řadí zjištěné hodnoty na určitou škálu (školní klasifikace, stupnice mzdových tarifů), lze pouze říci, která hodnota je menší a která větší. Vyjadřují v číselné podobě různou úroveň výskytu původně slovního znaku. Číselné znaky je možno dále rozdělit na přímo zjišťované a dopočtené (obytná plocha připadající na 1 osobu). Slovní (kvalitativní) znaky: Nominální znaky slovní proměnné, u jejichž obměn nelze objektivně jednoznačně stanovit pořadí (pohlaví, rodinný stav, apod.). Kódování: číselné vyjádření obměn slovního znaku (muž = 1, žena = 0, apod.), čísla nemají význam velikosti. Slovní znaky: sociologické výzkumy, marketingové výzkumy, degustační zkoušky, vyzrálost sýrů, jediným číselným znakem jsou zjištěné četnosti. Hodnoty x obměny znaku. Měřitelné znaky dále dělíme na: Spojité znaky reálná čísla (příjmy, výdaje, apod.). Diskrétní znaky nespojité hodnoty, celočíselné, nezáporné (počet dětí v domácnosti). STATISTICKÁ DATA (ÚDAJE): shromážděné hodnoty číselných a obměny slovních znaků pro určitý soubor statistických jednotek, typický způsob uchování dat: statistické databáze (např. Český statistický úřad, Eurostat), pokus vlastní data v tabulce v Excelu diplomová práce. Symbolika Číselné znaky velká písmena z konce abecedy: X, Y, Z

Úvodní statistické pojmy Slovní znaky velká písmena ze začátku abecedy: A, B, C Hodnoty číselného znaku X, tvořící statistický soubor o rozsahu n, označíme jako: x, x,... 1 2 xi,..., xn, xi, i = 1,2,..., n a obměny slovního znaku A, které tvoří statistický soubor o rozsahu n, značíme jako: a, a,... 2 ai,..., an, ai, i 1,2,..., n 1 = malá písmena, index i souvisí s pořadím zjišťování. Kvádr dat: xijk hodnota j-tého znaku na i-té jednotce v k-tém okamžiku. Analýza vlastností statistických jednotek by měla probíhat současně ve všech třech dimenzích, což by bylo obtížné. Dílčí analýzy: zjednodušený pohled na data: jeden znak, v jednom čase, pro různé jednotky analýza struktury hromadného jevu, dva znaky, v jednom čase, pro různé jednotky analýza závislosti, jeden znak, pro jednu jednotku v různém čase analýza vývoje (časová datová řada). STATISTICKÉ CHARAKTERISTIKY (UKAZATELE): hlavním cílem statistické analýzy je ze statistických údajů, které charakterizují každou statistickou jednotku zvlášť, získat informace, umožňující charakterizovat statistický soubor jako celek. Hodnoty statistických charakteristik měří určité vlastnosti datových souborů, jako např. úroveň nebo proměnlivost. Statistické charakteristiky: jsou nositeli informace funkce všech hodnot souboru x významné hodnoty, chybějící hodnoty minimalizovat ztrátu informace, podezřelé hodnoty chyby měření. Úroveň a variabilita dat.

Etapy statistického zkoumání Statistická šetření a zpracování dat ZJIŠŤOVÁNÍ ZPRACOVÁNÍ ANALÝZA PREZENTACE VÝSLEDKŮ Zjišťování: shromažďování a zaznamenávání údajů číselné (slovní) povahy o zkoumaném hromadném jevu úplné (vyčerpávající) neúplné (nevyčerpávající): nereprezentativní (nezobecnitelné) anketa metoda základního masívu (do souboru jsou zahrnuty jen velké statistické jednotky), reprezentativní (zobecnitelné, výběrové) výsledky lze zobecnit i na neprošetřenou část úsudkový (záměrný) výběr ve šlechtitelství, odborník určí, kterou jednotku zahrne do souboru, snaha vybrat typické jednotky náhodný (pravděpodobnostní) výběr - výběr se stejnými (sportka) a nestejnými pravděpodobnostmi - výběr s vracením (opakováním) a bez vracení (opakování) - přesnější, více se dovíme o souboru - přímý výběr jednotek x složitější uspořádání souboru Prosté pozorování (oblast sociálně ekonomických jevů vývoj kurzu akcie) x řízený experiment (oblast přírodních jevů polní pokusy, krmivářské pokusy), eliminují vliv rušivých faktorů. Primární údaje x sekundární údaje. Zpracování: spočívá v uspořádání zjištěných chaotických informací.

Statistická šetření a zpracování dat Číselnou (variační) řadu znaku X zapíšeme pomocí indexovaných hodnot znaku x 1, x 2,..., x i,..., x n-1, x n i = 1..n, kde n je počet případů (rozsah souboru) Zpracování třídění dat Analýza: základním úkolem statistické analýzy je ze statistických údajů, které charakterizují každou statistickou jednotku zvlášť, získat informaci, umožňující charakterizovat statistický soubor jako celek. Nositeli této informace jsou statistické charakteristiky (statistické ukazatele). Prezentace výsledků zpracování výsledků analýzy do srozumitelné podoby, vyjadřovací prostředky: statistické tabulky, grafy. Základním předpokladem úspěšné statistické analýzy je předběžná vizualizace neboli grafické znázornění vstupních dat.