ZÁKLADNÍ STATISTICKÉ POJMY HROMADNÝ JEV Statistika pracuje s tzv. HROMADNÝMI JEVY cílem statistického zpracování dat je podání informace o vlastnostech a zákonitostech hromadných jevů: velkého počtu jedinců (osob, věcí, jevů) jevů, které se mohou neustále opakovat, např. opakované měření vlastnosti jednoho objektu STATISTICKÝ SOUBOR je množina sledovaných objektů - statistických jednotek, které mají z hlediska statistického zkoumání společné vlastnosti
ZÁKLADNÍ STATISTICKÉ POJMY STATISTICKÁ JEDNOTKA je osoba, věc, jev, která/-ý je nositelem sledovaných vlastností nazývaných STATISTICKÉ ZNAKY STATISTICKÝ ZNAK je sledovaná vlastnost statistických jednotek (např. barva vlasů) Hodnota statistického znaku je vyjádřením stupně sledované vlastnosti (např. rezavá barva vlasů) Můžeme ji vyjádřit číslem (naměřenou nebo přiřazenou hodnotou) nebo jinak (např. slovním popisem)
ZÁKLADNÍ STATISTICKÉ POJMY STATISTICKÝ SOUBOR rozlišujeme základní statistický soubor neboli populace výběrový statistický soubor ZÁKLADNÍ SOUBOR (POPULACE) je většinou myšlenková konstrukce, která obsahuje veškerá data, se kterými pracujeme a není vždy snadné jej vymezit. VÝBĚROVÝ SOUBOR je část (podmnožina) základního souboru, která ho dobře reprezentuje a splňuje vlastnost náhodnosti.
ZÁKLADNÍ SOUBOR - POPULACE Je zadán buď výčtem prvků nebo vymezením některých společných vlastností. ROZSAH ZÁKLADNÍHO SOUBORU je počet jednotek ve zkoumaném statistickém souboru konečný soubor (počet jednotek je pevně dán) nekonečný soubor (jednotky mohou neomezeně přibývat, např. soubor narozených děti) U demografických souborů bývá vymezení dáno příslušnou územní oblastí, věkem, pohlavím, zaměstnáním, časovým okamžikem nebo intervalem sledování. Aritmetická přesnost u základních souborů měnících se v čase je pouhá fixe poplatná okamžiku - jedná se o přesný součet nepřesných čísel
VÝBĚROVÝ SOUBOR - VÝBĚR Existuje několik důvodů, kdy (proč) nelze provést šetření na celé populaci: analýza celého souboru může být ekonomicky nákladná nemůžeme provést šetření na nekonečně velkém počtu experimentálních jednotek. technicky není možné analýzu provést (např. chceme předvídat hodnoty pro ještě nenarozené jedince) Proto je výhodné pracovat s VÝBĚROVÝM SOUBOREM: je to část ZÁKLADNÍHO SOUBORU každá statistická jednotka ze základního souboru musí mít stejnou naději se dostat do výběru výběr musí reprezentovat základní soubor
REPREZENTATIVNOST a HOMOGENITA VÝBĚRU REPREZENTATIVNOST VÝBĚRU: vlastnosti VÝBĚRU by měly co nejlépe odpovídat vlastnostem celé populace. Základní populace je HOMOGENNÍ: rozdíly mezi sledovanými jedinci mohou být způsobeny pouze NÁHODOU. Základní populace není zcela HOMOGENNÍ: sledování výskytu klíšťové encefalitidy: v některých lokalitách je výskyt infikovaných klíšťat systematicky větší sledování krevního tlaku: závisí na věku osob sledování výšky dospělých osob: závisí na pohlaví
Statistika jako učení o hromadných jevech Moderní statistika, která je založena na výběrové analýze, se také zabývá výhradně hromadnými jevy. Zkoumá vybrané statistické jednotky (osoby, znaky nebo věci) a výsledky zobecňuje pro Základní soubor, ze kterého byl výběr proveden. Příklad: pro potřeby oděvního průmyslu nestačí zjistit průměrnou výšku populace (základního souboru), ale potřebujeme znát rozložení veličiny výška od nejmenších osob po nejvyšší osoby. Rozložením máme na mysli nejen interval (minimální výška - maximální výška), ale i počty jedinců různé výšky. Jinými slovy - pro popis celého souboru nás nezajímá pouze jeden typický reprezentant, ale chceme zjistit, jak vypadá celé spektrum sledovaného znaku (výšky osob)
Co to je ROZLOŽENÍ Z výsledků analýzy výběrového šetření lze odhadnout rozložení hodnot sledovaného znaku v základním souboru (populaci) Výběrový soubor vypovídá jen o tom základním souboru, ze kterého byl vybrán. Velmi charakteristické rozložení vykazují četná biologická měření, např. tělesné výšky, hodnoty cholesterolu, krevního tlaku apod. Např. je jasné, že průměrně vysokých lidí je hodně, zatímco velmi vysokých a velmi malých lidí je málo. Jedná se o tzv. Normální rozdělení. Je to nejčastější rozdělení biologických a dalších veličin Jiné rozdělení budou např. vykazovat počty hodnot 1, 2, 3, 4, 5, 6 při náhodném házení kostkou (rovnoměrné rozdělení) nebo třeba frekvence málo četných jevů, např. počet kazů v 1 m látky (Poissonovo rozdělení).
Vztah matematiky a statistiky Matematika je nástrojem statistiky. Moderní statistika nazývaná též MATEMATICKÁ STATISTIKA odvozuje své závěry na základě určitého matematického modelu a využívá matematický aparát. Základem MATEMATICKÉ STATISTIKY je teorie pravděpodobnosti - usuzování z neúplných údajů zatížených náhodným kolísáním. PŘESNOST je rozdíl měřené nebo počítané hodnoty od přesné Ve statistice jsou matematicky přesné a dokonalé jen výpočetní metody, výsledkem statistického zpracování jsou odhady a pravděpodobnosti
DALŠÍ STATISTICKÉ POJMY - PŘESNOST Ve statistice je přesnost poněkud jiná než např. v bance, kde úředník počítá s haléřovými položkami Bude-li nás zajímat výška populace, nebudeme měřit výšku vybraných jedinců v mm. Oskar Anderson napsal: Nemá cenu odvažovat fůru sena na chemicky přesných vahách Není nic platné odhadnout vzdálenost mezi dvěma městy v tisících kroků a pak k výsledku připočítat tloušťku městských hradeb v milimetrech
STATISTICKÉ PŘÍSTUPY rozlišujeme dva základní přístupy: DESKRIPTIVNÍ pracuje se základním souborem - získané výsledky popisují zkoumaný soubor a nesnaží se o žádné zobecnění na větší nebo jinou skupinu objektů. Sledované charakteristiky popisují soubor zcela přesně. INDUKTIVNÍ - pracuje s výběrovým souborem a snaží se o zobecnění (extrapolaci) výsledků na širší skupinu objektů, kterou je základní soubor (populace). ve statistice tuto metodu nazýváme INDUKTIVNÍ neboli ANALYTICKÁ STATISTIKA, kdy na základě zkoumání vlastností výběrového souboru usuzujeme na vlastnosti základního souboru
BIOMETRIE V BIOLOGII zkoumáme přírodní jevy, které neumíme zkoumat jako takové, ale jsme nuceni je popsat pomocí jednoho nebo více znaků tyto znaky daný jev určitým způsobem kvantifikují V BIOMETRII spolupracuje statistik s biologem (lékařem, výzkumníkem). Odborník z oboru zkoumaných dat stanoví, které měřené znaky ho zajímají, statistik navrhuje formát a rozsah výběrového souboru a metody statistického zpracování dat, nebo pomáhá naplánovat experiment, jehož výsledkem jsou statistická data.