Základní statistické charakteristiky
Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme
Základní statistické charakteristiky Dva hlavní druhy základních charakteristik statistického souboru: charakteristiky úrovně, polohy (střední hodnoty) charakteristiky variability Další : charakteristiky asymetrie charakteristiky špičatosti
Základní statistické charakteristiky Způsoby výpočtu: z reálných(skutečně pozorovaných) hodnot (menší statistické soubory) ze skupinového rozdělení četností (rozsáhlejší soubory, interval zastupuje jeho střed)
Střední hodnoty = čísla (charakteristiky), která zastupují hodnoty zkoumaného statistického znaku udávají polohu rozdělení četností, velikost zkoumaného jevu v daném souboru atd.
Střední hodnoty Význam: jedno číslo nahrazuje dlouhou řadu hodnot znaku snadné porovnávání dvou i více statistických souborů
Střední hodnoty Aritmetický průměr Geometrický průměr Harmonický průměr Modus Aritmetický střed Medián
Aritmetický průměr = úhrn hodnot kvantitativního statistického znaku, dělený rozsahem souboru x n i 1 n x i
Aritmetický průměr - vlastnosti algebraický součet všech odchylek jednotlivých hodnot znaku od aritmetického průměru je roven nule je-li znak konstantní, průměr je roven této konstantě přičteme-li ke všem hodnotám znaku konstantu k, zvětší se i průměr o tuto konstantu vynásobíme-li všechny hodnoty znaku konstantou k, je i průměr k- krát větší
Aritmetický průměr nejčastěji používaná statistická charakteristika výpočet jednoduchý, snadný nemusí vždy podávat správnou informaci typický, netypický průměr rozdělení četností s jedním a více vrcholy
Aritmetický průměr jako typický průměr AP nemusí podávat za určitých podmínek správnou informaci Záleží na rozdělení četností sledovaného jevu (jedno- x vícevrcholové rozdělení četností) Neexistuje definice typického x netypického AP, typický je zpravidla ten, který se blíží nejčastější hodnotě (důležité při prezentaci studovaného jevu).
Vážený aritmetický průměr Jednotlivé hodnoty znaku označíme jako x 1, x 2, x 3,, x k (kde k je počet různých variant hodnot znaku) a četnosti výskytu jednotlivých hodnot znaku (váhy) označíme n 1, n 2, n 3,, n k, pak vzorec váženého aritmetického průměru bude mít tvar : x k i1 k i1 x n i i n i
Př. Použití váženého aritmetického průměru. Vypočítej aritmetický a aritmetický vážený průměr známek (váhy = počet kreditů). MA ST KL GM GE BI KA OB ME TC váhy (počet kreditů) 6 5 5 6 5 6 8 6 6 3 známky 1 2 1 2 2 1 3 1 1 1
Vážený aritmetický průměr Použití v geografii: meteorologie a klimatologie výpočet množství srážek, které spadne v určitém povodí výpočet průměrné denní teploty
Vážený aritmetický průměr máme-li sestavenu tabulku rozdělení četností, užijeme pro výpočet aritmetického průměru takto rozděleného statistického souboru váženého aritmetického průměru x k i 1 k i 1 x n i n i i x i - středy intervalů n i - četnost příslušného intervalu
Rok Průměrná teplota( C) Rok Průměrná teplota ( C) Rok Průměrná teplota ( C) 1 7,4 18 8,8 35 9,1 2 9,6 19 8,9 36 9,4 3 8,1 20 9,3 37 8,8 4 9,1 21 7,9 38 8,9 5 7,9 22 8,4 39 8,7 6 8,3 23 8,6 40 9,1 7 9,4 24 10,2 41 9,3 8 10,3 25 10,5 42 9,5 9 9,9 26 10,8 43 9,6 10 10,1 27 9,4 44 9,9 11 8,5 28 9,8 45 8,8 12 8,2 29 9,3 46 8,5 13 7,7 30 8,5 47 9,0 14 10,0 31 9,9 48 9,2 15 11,1 32 10,7 49 9,4 16 10,9 33 9,4 50 9,6 17 9,7 34 9,6
intervaly střed intervalu absolutní (n i ) relativní (f i ) četnosti kumulovaná relativní (F i ) kumulovaná absolutní (N i ) 6,6-7,0 6,8 0 0 0 0 7,1-7,5 7,3 1 0,02 0,02 1 7,6-8,0 7,8 3 0,06 0,08 4 8,1-8,5 8,3 7 0,14 0,22 11 8,6-9,0 8,8 8 0,16 0,38 19 9,1-9,5 9,3 13 0,26 0,64 32 9,6-10,0 9,8 10 0,2 0,84 42 10,1-10,5 10,3 4 0,08 0,92 46 10,6-11,0 10,8 3 0,06 0,98 49 11,1-11,5 11,3 1 0,02 1 50 11,6-12,0 11,8 0 0 1 50 50 1
Geometrický průměr = uplatnění v případech, kdy hodnoty tvoří alespoň přibližně geometrickou řadu - analýza časových řad, výpočty tempa růstu atd. n xg x1* x2 *...* xn
Modus = nejčetnější hodnota kvantitativního znaku studovaného souboru = nejčastější hodnota sledovaného znaku (modální interval)
Modus Výpočet ze skupinového rozdělení četností: n x L h 2 n 1 n 2
Modus Důležitý při vystižení typické hodnoty znaku v daném souboru, následně při porovnávání typických hodnot souborů, pokud jde o typické hodnoty znaku.
Aritmetický střed Není příliš vhodný, nevýhody xst x max 2 x min
Medián = prvek řady, uspořádané v neklesajícím pořadí, který ji rozděluje v tom smyslu, že polovina prvků této řady má menší hodnotu znaku a polovina má větší hodnotu znaku, než je hodnota mediánu
Medián Má-li řada rozsah n a je uspořádaná, pak medián je hodnota, která má pořadové číslo: n 2 1 - pro n liché, resp. průměr hodnot s pořadovými čísly pro n sudé n 2 a n 2 1
Medián Výhoda: jednoduchost výpočtu Lépe zachycuje úroveň než průměr Dělí soubor na dvě poloviny
Kvartil, decil, percentil = obdoby mediánu Oddělují horní a dolní čtvrtiny souboru atd. Snadné sestrojení z křivky kumulovaných četností.
Geografický medián Má stejnou vlastnost: půlí pozorovaný soubor na dvě stejné části. Jde o čáru rozdělující plochu, na níž se jev vyskytuje.
Charakteristiky variability = čísla, která charakterizují stupeň proměnlivosti statistického znaku v daném statistickém souboru = důležitý doplněk informací, které poskytují střední hodnoty
Variační rozpětí R x max x min
Kvartilová odchylka Q ( x ) ( 75 x x x25) 2
Decilová, percentilová odchylka D ( x ) ( 90 x x x10) 8 P ( x ) ( 99 x x x1) 98
Průměrná odchylka d x n xi x i 1 i 1 n d x k xi k i 1 x ni ni
Relativní průměrná odchylka D d x Při vynásobení stem v %
Střední diference = aritmetický průměr absolutních hodnot všech možných vzájemných rozdílů n jednotlivých hodnot sledovaného znaku x n n i 1 j 1 x x i j n( n 1)
Střední diference Vhodná míra variability pro soubory s malým rozsahem. Jinak velmi pracné.
Rozptyl, směrodatná odchylka = nejdůležitější charakteristiky variace hodnot znaků ve statistickém souboru rozptyl: s 2 směrodatná odchylka: s
Rozptyl = průměr ze čtverců odchylek jednotlivých hodnot znaku od jejich aritmetického průměru s2 n i 1 ( x i x) n 2
Rozptyl V případě skupinového rozdělení četností: s2 k i 1 ( x x) 2 s ni k i 1 n i
Směrodatná odchylka Používá se častěji, jde o druhou odmocninu rozptylu. Je mírou rozptylu hodnot veličiny kolem průměru. x i náhodné
Variační koeficient = nejpoužívanější relativní míra variability = poměr směrodatné odchylky k průměru = je mírou bezrozměrnou v s x
Charakteristiky asymetrie = míry šikmosti (asymetrie, nesouměrnosti), jsou čísla, která charakterizují nesouměrnost rozdělení četností. koeficient asymetrie
Koeficient asymetrie = aritmetický průměr z třetích mocnin odchylek jednotlivých hodnot znaku od aritmetického průměru vyjádřených v jednotkách směrodatné odchylky
Koeficient asymetrie Ze skupinového rozdělení četností se vypočítá: k i 1 n ( xi x) i 3 ns3
Koeficient asymetrie 0 rozdělení četností je souměrné 0 rozdělení četností je sešikmeno doleva (kladná šikmost) 0 rozdělení četností je sešikmeno doprava (záporná šikmost)
Charakteristiky špičatosti = čísla, která charakterizují koncentraci prvků souboru v blízkosti určité hodnoty znaku = poskytují představu o tvaru rozdělení četností co do špičatosti nebo plochosti míra koncentrace kolem mediánu koeficient špičatosti
Koeficient špičatosti = průměrná hodnota součtu čtvrtých mocnin odchylek hodnot x i od aritmetického průměru měřených v jednotkách směrodatné odchylky s
Koeficient špičatosti Ze skupinového rozdělení četností se vypočítá: k i 1 n ( ) 4 i xi x ns4 3
Koeficient špičatosti 0 rozdělení četností je normálně zašpičatělé 0 rozdělení četností je kladně zašpičatělé (špičaté) 0 rozdělení četností je záporně zašpičatělé (ploché)
Děkuji za pozornost.