Základní statistické charakteristiky

Podobné dokumenty
3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1

Statistika pro geografy

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

Číselné charakteristiky a jejich výpočet

Číselné charakteristiky

charakteristiky KGG/STG Zimní semestr Základní statistické charakteristiky, Teoretická rozdělení 1

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

STATISTICKÉ CHARAKTERISTIKY

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Zápočtová práce STATISTIKA I

Metodologie pro ISK II

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Charakteristika datového souboru

MATEMATIKA III V PŘÍKLADECH

Základy popisné statistiky

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Praktická statistika. Petr Ponížil Eva Kutálková

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

UKAZATELÉ VARIABILITY

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Pravděpodobnost a statistika

Popisná statistika. Statistika pro sociology

STATISTIKA PRO VEŘEJNOU SPRÁVU


Základní statistické pojmy

Statistika I (KMI/PSTAT)

Obecné momenty prosté tvary

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Předmět studia: Ekonomická statistika a analytické metody I, II

Jevy a náhodná veličina

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

EXPLORATORNÍ ANALÝZA DAT. 7. cvičení

TECHNICKÁ UNIVERZITA V LIBERCI

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

Statistika. zpracování statistického souboru

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Metodologie pro Informační studia a knihovnictví 2

Mnohorozměrná statistická data

VNITROSKUPINOVÝ ROZPTYL. Je mírou variability uvnitř skupin Jiný název: průměr rozptylů Vypočítává se jako průměr rozptylů v jednotlivých skupinách

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

zcela převažující druh průměru, který má uplatnění při řešení téměř všech úloh statistiky široké využití: v ekonomických

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Statistika jako obor. Statistika. Popisná statistika. Matematická statistika TEORIE K MV2

Analýza dat na PC I.

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Popisná statistika kvantitativní veličiny

Metodologie pro Informační studia a knihovnictví 2

23. Matematická statistika

Vybrané statistické metody. You created this PDF from an application that is not licensed to print to novapdf printer (

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Minimální hodnota. Tabulka 11

Informační technologie a statistika 1

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Mnohorozměrná statistická data

Statistika - charakteristiky variability

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Cvičení ze statistiky. Filip Děchtěrenko ZS 2012/2013

Obecné, centrální a normované momenty

LEKCE 02a UNIVARIAČNÍ ANALÝZA KATEGORIZOVANÝCH DAT

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

Statistika pro gymnázia

Charakterizace rozdělení

Matematická statistika

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Požadavky k opravným zkouškám z matematiky školní rok

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Popisná statistika. Komentované řešení pomocí MS Excel

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Pracovní list č. 3 Charakteristiky variability

Aplikovaná statistika v R

Základy popisné statistiky

Renáta Bednárová STATISTIKA PRO EKONOMY

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Náhodná veličina a rozdělení pravděpodobnosti

Základy biostatistiky

Seminarni prace. 2 3 stranky staci, dat nema byt 3 a nema jich byt pul milionu. k te seminarce

Téma 2. Řešené příklady

mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.

IES FSV UK. Domácí úkol Pravděpodobnost a statistika I. Cyklistův rok

STATISTICKÉ METODY V GEOGRAFII. Kdybych měl poslední den života, chtěl bych ho strávit na přednášce ze statistiky - je tak nekonečně dlouhá.

Tomáš Karel LS 2012/2013

STATISTIKA 1. RNDr. K. Hrach, Ph.D. Zápočet: odevzdání seminární práce (úkoly na PC) Zkouška: písemná (bez kalkulačky, bez vzorců)

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta

Transkript:

Základní statistické charakteristiky

Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme

Základní statistické charakteristiky Dva hlavní druhy základních charakteristik statistického souboru: charakteristiky úrovně, polohy (střední hodnoty) charakteristiky variability Další : charakteristiky asymetrie charakteristiky špičatosti

Základní statistické charakteristiky Způsoby výpočtu: z reálných(skutečně pozorovaných) hodnot (menší statistické soubory) ze skupinového rozdělení četností (rozsáhlejší soubory, interval zastupuje jeho střed)

Střední hodnoty = čísla (charakteristiky), která zastupují hodnoty zkoumaného statistického znaku udávají polohu rozdělení četností, velikost zkoumaného jevu v daném souboru atd.

Střední hodnoty Význam: jedno číslo nahrazuje dlouhou řadu hodnot znaku snadné porovnávání dvou i více statistických souborů

Střední hodnoty Aritmetický průměr Geometrický průměr Harmonický průměr Modus Aritmetický střed Medián

Aritmetický průměr = úhrn hodnot kvantitativního statistického znaku, dělený rozsahem souboru x n i 1 n x i

Aritmetický průměr - vlastnosti algebraický součet všech odchylek jednotlivých hodnot znaku od aritmetického průměru je roven nule je-li znak konstantní, průměr je roven této konstantě přičteme-li ke všem hodnotám znaku konstantu k, zvětší se i průměr o tuto konstantu vynásobíme-li všechny hodnoty znaku konstantou k, je i průměr k- krát větší

Aritmetický průměr nejčastěji používaná statistická charakteristika výpočet jednoduchý, snadný nemusí vždy podávat správnou informaci typický, netypický průměr rozdělení četností s jedním a více vrcholy

Aritmetický průměr jako typický průměr AP nemusí podávat za určitých podmínek správnou informaci Záleží na rozdělení četností sledovaného jevu (jedno- x vícevrcholové rozdělení četností) Neexistuje definice typického x netypického AP, typický je zpravidla ten, který se blíží nejčastější hodnotě (důležité při prezentaci studovaného jevu).

Vážený aritmetický průměr Jednotlivé hodnoty znaku označíme jako x 1, x 2, x 3,, x k (kde k je počet různých variant hodnot znaku) a četnosti výskytu jednotlivých hodnot znaku (váhy) označíme n 1, n 2, n 3,, n k, pak vzorec váženého aritmetického průměru bude mít tvar : x k i1 k i1 x n i i n i

Př. Použití váženého aritmetického průměru. Vypočítej aritmetický a aritmetický vážený průměr známek (váhy = počet kreditů). MA ST KL GM GE BI KA OB ME TC váhy (počet kreditů) 6 5 5 6 5 6 8 6 6 3 známky 1 2 1 2 2 1 3 1 1 1

Vážený aritmetický průměr Použití v geografii: meteorologie a klimatologie výpočet množství srážek, které spadne v určitém povodí výpočet průměrné denní teploty

Vážený aritmetický průměr máme-li sestavenu tabulku rozdělení četností, užijeme pro výpočet aritmetického průměru takto rozděleného statistického souboru váženého aritmetického průměru x k i 1 k i 1 x n i n i i x i - středy intervalů n i - četnost příslušného intervalu

Rok Průměrná teplota( C) Rok Průměrná teplota ( C) Rok Průměrná teplota ( C) 1 7,4 18 8,8 35 9,1 2 9,6 19 8,9 36 9,4 3 8,1 20 9,3 37 8,8 4 9,1 21 7,9 38 8,9 5 7,9 22 8,4 39 8,7 6 8,3 23 8,6 40 9,1 7 9,4 24 10,2 41 9,3 8 10,3 25 10,5 42 9,5 9 9,9 26 10,8 43 9,6 10 10,1 27 9,4 44 9,9 11 8,5 28 9,8 45 8,8 12 8,2 29 9,3 46 8,5 13 7,7 30 8,5 47 9,0 14 10,0 31 9,9 48 9,2 15 11,1 32 10,7 49 9,4 16 10,9 33 9,4 50 9,6 17 9,7 34 9,6

intervaly střed intervalu absolutní (n i ) relativní (f i ) četnosti kumulovaná relativní (F i ) kumulovaná absolutní (N i ) 6,6-7,0 6,8 0 0 0 0 7,1-7,5 7,3 1 0,02 0,02 1 7,6-8,0 7,8 3 0,06 0,08 4 8,1-8,5 8,3 7 0,14 0,22 11 8,6-9,0 8,8 8 0,16 0,38 19 9,1-9,5 9,3 13 0,26 0,64 32 9,6-10,0 9,8 10 0,2 0,84 42 10,1-10,5 10,3 4 0,08 0,92 46 10,6-11,0 10,8 3 0,06 0,98 49 11,1-11,5 11,3 1 0,02 1 50 11,6-12,0 11,8 0 0 1 50 50 1

Geometrický průměr = uplatnění v případech, kdy hodnoty tvoří alespoň přibližně geometrickou řadu - analýza časových řad, výpočty tempa růstu atd. n xg x1* x2 *...* xn

Modus = nejčetnější hodnota kvantitativního znaku studovaného souboru = nejčastější hodnota sledovaného znaku (modální interval)

Modus Výpočet ze skupinového rozdělení četností: n x L h 2 n 1 n 2

Modus Důležitý při vystižení typické hodnoty znaku v daném souboru, následně při porovnávání typických hodnot souborů, pokud jde o typické hodnoty znaku.

Aritmetický střed Není příliš vhodný, nevýhody xst x max 2 x min

Medián = prvek řady, uspořádané v neklesajícím pořadí, který ji rozděluje v tom smyslu, že polovina prvků této řady má menší hodnotu znaku a polovina má větší hodnotu znaku, než je hodnota mediánu

Medián Má-li řada rozsah n a je uspořádaná, pak medián je hodnota, která má pořadové číslo: n 2 1 - pro n liché, resp. průměr hodnot s pořadovými čísly pro n sudé n 2 a n 2 1

Medián Výhoda: jednoduchost výpočtu Lépe zachycuje úroveň než průměr Dělí soubor na dvě poloviny

Kvartil, decil, percentil = obdoby mediánu Oddělují horní a dolní čtvrtiny souboru atd. Snadné sestrojení z křivky kumulovaných četností.

Geografický medián Má stejnou vlastnost: půlí pozorovaný soubor na dvě stejné části. Jde o čáru rozdělující plochu, na níž se jev vyskytuje.

Charakteristiky variability = čísla, která charakterizují stupeň proměnlivosti statistického znaku v daném statistickém souboru = důležitý doplněk informací, které poskytují střední hodnoty

Variační rozpětí R x max x min

Kvartilová odchylka Q ( x ) ( 75 x x x25) 2

Decilová, percentilová odchylka D ( x ) ( 90 x x x10) 8 P ( x ) ( 99 x x x1) 98

Průměrná odchylka d x n xi x i 1 i 1 n d x k xi k i 1 x ni ni

Relativní průměrná odchylka D d x Při vynásobení stem v %

Střední diference = aritmetický průměr absolutních hodnot všech možných vzájemných rozdílů n jednotlivých hodnot sledovaného znaku x n n i 1 j 1 x x i j n( n 1)

Střední diference Vhodná míra variability pro soubory s malým rozsahem. Jinak velmi pracné.

Rozptyl, směrodatná odchylka = nejdůležitější charakteristiky variace hodnot znaků ve statistickém souboru rozptyl: s 2 směrodatná odchylka: s

Rozptyl = průměr ze čtverců odchylek jednotlivých hodnot znaku od jejich aritmetického průměru s2 n i 1 ( x i x) n 2

Rozptyl V případě skupinového rozdělení četností: s2 k i 1 ( x x) 2 s ni k i 1 n i

Směrodatná odchylka Používá se častěji, jde o druhou odmocninu rozptylu. Je mírou rozptylu hodnot veličiny kolem průměru. x i náhodné

Variační koeficient = nejpoužívanější relativní míra variability = poměr směrodatné odchylky k průměru = je mírou bezrozměrnou v s x

Charakteristiky asymetrie = míry šikmosti (asymetrie, nesouměrnosti), jsou čísla, která charakterizují nesouměrnost rozdělení četností. koeficient asymetrie

Koeficient asymetrie = aritmetický průměr z třetích mocnin odchylek jednotlivých hodnot znaku od aritmetického průměru vyjádřených v jednotkách směrodatné odchylky

Koeficient asymetrie Ze skupinového rozdělení četností se vypočítá: k i 1 n ( xi x) i 3 ns3

Koeficient asymetrie 0 rozdělení četností je souměrné 0 rozdělení četností je sešikmeno doleva (kladná šikmost) 0 rozdělení četností je sešikmeno doprava (záporná šikmost)

Charakteristiky špičatosti = čísla, která charakterizují koncentraci prvků souboru v blízkosti určité hodnoty znaku = poskytují představu o tvaru rozdělení četností co do špičatosti nebo plochosti míra koncentrace kolem mediánu koeficient špičatosti

Koeficient špičatosti = průměrná hodnota součtu čtvrtých mocnin odchylek hodnot x i od aritmetického průměru měřených v jednotkách směrodatné odchylky s

Koeficient špičatosti Ze skupinového rozdělení četností se vypočítá: k i 1 n ( ) 4 i xi x ns4 3

Koeficient špičatosti 0 rozdělení četností je normálně zašpičatělé 0 rozdělení četností je kladně zašpičatělé (špičaté) 0 rozdělení četností je záporně zašpičatělé (ploché)

Děkuji za pozornost.