STATISTICKÉ CHARAKTERISTIKY

Podobné dokumenty
veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Zápočtová práce STATISTIKA I

Charakteristika datového souboru

Základní statistické charakteristiky

Číselné charakteristiky

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

Statistika pro geografy

Číselné charakteristiky a jejich výpočet

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

MATEMATIKA III V PŘÍKLADECH

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Metodologie pro ISK II

Praktická statistika. Petr Ponížil Eva Kutálková

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Základy popisné statistiky

UKAZATELÉ VARIABILITY

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Obecné, centrální a normované momenty

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Popisná statistika. Statistika pro sociology

Pravděpodobnost a statistika


Popisná statistika kvantitativní veličiny

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Popisná statistika. Komentované řešení pomocí MS Excel

Analýza dat na PC I.

mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.

TECHNICKÁ UNIVERZITA V LIBERCI

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Metodologie pro Informační studia a knihovnictví 2

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek

Cvičení ze statistiky. Filip Děchtěrenko ZS 2012/2013

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Manuál pro zaokrouhlování

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Charakterizace rozdělení

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Informační technologie a statistika 1

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Metodologie pro Informační studia a knihovnictví 2

Jevy a náhodná veličina

Neparametrické metody

TLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ

Aplikovaná statistika v R

Základy pravděpodobnosti a statistiky. Popisná statistika

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Příloha podrobný výklad vybraných pojmů

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Statistika - charakteristiky variability

Neparametrické testy

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Protokol č. 1. Tloušťková struktura. Zadání:

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Kontrola: Sečteme-li sloupec,,četnost výskytu musí nám vyjít hodnota rozsahu souboru (našich 20 žáků)

Statistické zpracování výsledků

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Statistika jako obor. Statistika. Popisná statistika. Matematická statistika TEORIE K MV2

Průzkumová analýza dat

charakteristiky KGG/STG Zimní semestr Základní statistické charakteristiky, Teoretická rozdělení 1

23. Matematická statistika

PRŮZKUMOVÁ ANALÝZA DAT (EDA)

Náhodná veličina a rozdělení pravděpodobnosti

Posouzení přesnosti měření

Jednofaktorová analýza rozptylu

Minimální hodnota. Tabulka 11

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

Předmět studia: Ekonomická statistika a analytické metody I, II

Základní statistické pojmy

LEKCE 02a UNIVARIAČNÍ ANALÝZA KATEGORIZOVANÝCH DAT

VNITROSKUPINOVÝ ROZPTYL. Je mírou variability uvnitř skupin Jiný název: průměr rozptylů Vypočítává se jako průměr rozptylů v jednotlivých skupinách

Základy popisné statistiky

Kontingenční tabulky v Excelu. Představení programu Statistica

MATEMATICKÁ STATISTIKA - XP01MST

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

Náhodné (statistické) chyby přímých měření

Transkript:

STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021) za přispění finančních prostředků EU a státního rozpočtu České republiky.

DATA INFORMACE 2 Statistická analýza je založena na zhušťování informace tj. jak z co nejmenšího množství vhodně zvolených údajů vytěžit maximum relevantních informací (tj. informací, které řeší studovaný praktický problém, odpovídají na položené otázky, hypotézy). 1. prvotní zápis naprosto neuspořádaná data, údaje v té podobě, a v tom pořadí jak jsou naměřeny většinou nemůžeme postřehnout žádné společné podstatné vlastnosti 2. tříděný soubor jednotlivá měřená data jsou tříděna do tříd, místo všech původních dat používáme třídní reprezentanty a počty hodnot ve třídách dnes se příliš nepoužívají, účelem třídění bylo především zjednodušení výpočtů, ale také alespoň částečně zpřehledňují data podrobněji teorie text I, str. 16-23 3. statistické charakteristiky speciální veličiny, které podávají koncentrovanou formou informaci o podstatných statistických vlastnostech studovaného souboru

STATISTICKÉ CHARAKTERISTIKY statistické charakteristiky speciální veličiny, které podávají koncentrovanou formou informaci o podstatných statistických vlastnostech studovaného souboru. Správně zvolené a správným způsobem vypočítané charakteristiky (především musí být dodrženy podmínky jejich platnosti) obsahují v rámci jednoho nebo několika málo čísel veškerou informaci o podstatných statistických vlastnostech studovaného souboru, která je obsažena v původních datech, tj. v prvotním zápisu. Jsou založeny na dvou odlišných principech stanovení: charakteristiky momentové charakteristiky kvantilové 3

MOMENTOVÉ CHARAKTERISTIKY 4 Jsou založeny na principu statistických momentů. Vycházíme z analogie fyzikálních momentů, např. moment síly jako součin síly a jejího ramene. Ve statistické analogii je silou četnost určité hodnoty, ramenem potom vzdálenost této hodnoty od určitého bodu (např. nuly, průměru nebo libovolného bodu na číslelné ose). Potom na výpočet příslušné charakteristiky mají větší vliv hodnoty, které mají vyšší sílu, tj. četnost nebo které mají velké rameno síly, tj. jsou více vzdálené od společného počátečního bodu.

MOMENTOVÉ CHARAKTERISTIKY četnosti n i = síly vzdálenosti od počátku (o i =x i -x 0 ) = ramena síly Moment I. řádu: n i. o i Moment II. řádu: n i. o 2 i Moment k-tého řádu: n i. o k i n 2 n 3 o 3 =x 3 x 0 n 0 n i tento bod má malou četnost (n m ), ale je poměrně hodně vzdálen od počátku (o m ), proto ve výpočtu momentové charakteristiky bude mít značnou váhu, podobnou váze daleko četnějších hodnot (např. n 3 ), které jsou ale blíže (o 3 ) společnému počátečnímu bodu (x 0 ) n 1 n m x 1 x 2 x 3 x 0 x i x m 5 o 1 =x 1 x 0 o 2 =x 2 x 0 o i =x i x 0 o m =x m x 0

MOMENTOVÉ CHARAKTERISTIKY Statistický moment k-tého řádu je aritmetický průměr všech momentů k-tého řádu (pro všechna x i ) vztažených k hodnotě x 0. 6 Podle polohy bodu x 0 rozeznáváme statistické momenty: 1. Všeobecné (x 0 = 0) ( ) 2. Centrální (x 0 = x ) n n 1 k= 1 1 k = i i 0 = i k n i= 1 n i= 1 o i=xi-x0 Aritm.průměr 1 n k k = i ( i ) n i = 1 m n x n x m n x x k=2 rozptyl k=3 koef.nesouměrnosti k=3 koef. špičatosti

MOMENTOVÉ CHARAKTERISTIKY Aritmetický průměr = m 1 všeobecný moment 1.řádu) Rozptyl = m 2 Koeficient nesouměrnosti = m 3 /(m 2 3/2 ) = m 3 /s 3 Koeficient špičatosti = m 4 /(m 22 ) = m 3 /s 4 centrální moment 7

MOMENTOVÉ CHARAKTERISTIKY Vlastnosti momentových charakteristik: jsou vypočítány ze všech hodnot souboru (z toho vyplývá, že obsahují úplnou statistickou informaci, a proto se používají jako nejlepší charakteristiky prioritně, pokud jsou splněny níže uvedené podmínky), nejsou vhodné pro soubory s extrémními hodnotami rozdělení hodnot souboru musí odpovídat normálnímu (Gaussovu) rozdělení (viz prezentace rozdělení nebo teorie text I, str. 71-77) nejsou vhodné pro velmi malé soubory 8

KVANTILOVÉ CHARAKTERISTIKY Kvantil je hodnota určitým způsobem v souboru umístěná. Zpravidla je určena svým pořadím ve vzestupně uspořádaném souboru a leží pod ní (100.p) % hodnot souboru. Hodnota p se pohybuje mezi 0 a 1. 9 Pořadí kvantilu se určí: i = N rozsah souboru p počet skupin dělení. r pořadí kvantilu N+ 1 p r

KVANTILOVÉ CHARAKTERISTIKY Důležité kvantily: 25% kvantil dolní kvartil 50% kvantil medián 75% kvantil horní kvartil Další používané kvantily: 10% kvantil decil 12,5% kvantil oktil 6,25 % kvantil - sedecil minimum 1. (dolní) kvartil 2. kvartil (medián) 3. (horní) kvartil maximum 25% všech hodnot 25% všech hodnot 25% všech hodnot 25% všech hodnot 10 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59

KVANTILOVÉ CHARAKTERISTIKY Výhody kvantilových charakteristik: nejsou ovlivněny extrémními hodnotami jsou vhodné i pro malé soubory nezávisí na rozdělení veličiny jsou snadno zjistitelné a interpretovatelné Nevýhody kvantilových charakteristik: nevycházejí ze všech hodnot souborů, pouze z hodnot určitého pořadí nelze s nimi provádět matematické operace v plném rozsahu nevypovídají o některých zvláštnostech statistických souborů (např. extrémy) 11

KVANTILOVÉ CHARAKTERISTIKY Kvantilové charakteristiky se používají tehdy, pokud nejsou splněny podmínky momentových charakteristik, tj. pro soubory s výraznými extrémy, se silně nenormálním rozdělením dat nebo pro velmi malé soubory (a samozřejmě tím více pro jakoukoli kombinaci těchto podmínek) 12

STATISTICKÉ CHARAKTERISTIKY Statistické charakteristiky polohy variability tvaru momentové kvantilové momentové kvantilové momentové kvantilové 13

STATISTICKÉ CHARAKTERISTIKY podrobněji viz teorie text I, kap. 4 str. 24-48 Pamatujte, že pro správné statistické zhodnocení jakéhokoliv souboru je nutné použít charakteristiky všech tří skupin polohy, variability a tvaru protože každá z nich popisuje soubor z jiného hlediska. Je tedy zcela nesprávné používat např. izolovaně jen aritmetický průměr bez dalších údajů o souboru, který reprezentuje (např. údaje v médiích o průměrných platech nemají prakticky žádnou vypovídací schopnost, viz např. srovnání průměrů a jednotlivých kvantilů platů http://user.mendelu.cz/drapela/statisticke_metody/prezentace/ soubor Prumerne_platy.xls ) viz např. srovnání průměrů a mediánu platů o významu jejich srovnání viz následující snímky. 14

STATISTICKÉ CHARAKTERISTIKY Typy charakteristik: 1. polohy reprezentace souboru na číselné ose 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 15

STATISTICKÉ CHARAKTERISTIKY Typy charakteristik: 2. variability rozptýlení hodnot po číselné ose navzájem a vůči charakteristice polohy 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 16 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

STATISTICKÉ CHARAKTERISTIKY Typy charakteristik: 3. tvaru rozložení četností hodnot 17 absolutní třídní četnost 16 14 12 10 8 6 4 2 0 18 16 14 12 10 8 6 4 2 0 5 13 15 15 5 1 1 30.85 35.05 39.25 43.45 47.65 51.85 56.05 třídní reprezentanti 1 2 3 4 5 6 16 14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 10 11

CHARAKTERISTIKY POLOHY ARITMETICKÝ PRŮMĚR hodnota reprezentující všechny hodnoty souboru s nejmenší chybou MEDIÁN 50% kvantil, prostřední hodnota vzestupně uspořádaného souboru MODUS nejčastěji se vyskytující hodnota v souboru 18

19 základní statistická MOMENTOVÁ charakteristika polohy je to hodnota, která reprezentuje VŠECHNY hodnoty souboru s nejmenší chybou fyzikálně je možné jej považovat za těžiště souboru N x x N 1 i i 1 = = N x n x m 1 i i i 2 = =

základní statistická KVANTILOVÁ charakteristika polohy je to hodnota, která reprezentuje PROSTŘEDNÍ PRVEK VZESTUPNĚ USPOŘÁDANÉHO SOUBORU 20 x~ = 1 2 x ( N+ 1) ( ) x + x ( N ) ( N + 1) 2 2 2 pro pro N liché N sudé

MEDIÁN Stanovení mediánu: 1) stanovit pořadové číslo mediánu podle vzorce na předchozím snímku (závisí na tom, zda je sudý nebo lichý počet hodnot) 2) na základě pořadového čísla stanovit medián lichý počet hodnot N = 11 pořadové číslo mediánu: (N+1)/2 = (11+ 1)/2 = 6 šestá hodnota je medián sudý počet hodnot N = 10 pořadové číslo mediánu: (N+1)/2 = (10+ 1)/2 = 5,5 medián je průměr mezi pátou a šestou hodnotou 5. 6. 21

POUŽITÍ PRŮMĚRU A MEDIÁNU Soubor bez extrémních hodnot: medián průměr 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Soubor s extrémními hodnotami: d iámedián průměr 22 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60

POUŽITÍ PRŮMĚRU A MEDIÁNU Z předchozího obrázku vyplývá, že průměr je vždy vytahován za extrémy, tedy platí, že pokud je průměr výrazně vyšší než medián, jsou v souboru extrémy nejvyšších hodnot pokud je průměr výrazně menší než medián, jsou v souboru extrémy nejmenších hodnot 23

MODUS nejčastěji se vyskytující hodnota souboru existují soubory: amodální bez modu (všechny prvky souboru mají stejnou četnost) unimodální jeden modus polymodální dva a více modů nemá příliš velkou vypovídací schopnost 24

CHARAKTERISTIKY VARIABILITY informují o tom, jak jsou jednotlivé hodnoty souboru rozptýleny, tj. jak se jednotlivé hodnoty znaku liší vzhledem k sobě navzájem nebo vzhledem ke střední hodnotě existují dva typy: absolutní - mají rozměr studované veličiny relativní (poměrné) - bez rozměru nebo v procentech. Jsou vhodné pro porovnání variability různých souborů 25

CHARAKTERISTIKY VARIABILITY 26 variační rozpětí rozdíl maximální a minimální hodnoty rozptyl základní momentová míra variability, průměr čtverců odchylek od průměru směrodatná odchylka odmocnina z rozptylu, využívaná hlavně pro popis souborů variační koeficient relativní míra variability užívaná ke srovnání variability různých souborů kvantilové odchylky kvantilová míra variability počítaná obvykle z kvartilů nebo decilů interkvartilové rozpětí rozdíl horního a dolního kvartilu

ROZPTYL Rozptyl je základní mírou variability. Je to aritmetický průměr čtverců odchylek od průměru a je tedy konstruován k vyjádření variability hodnot kolem průměru, ale vyjadřuje i vzájemnou odlišnost hodnot znaku (Druhé mocniny odchylek jsou zde proto, aby se při výpočtu průměrné odchylky nevyrovnávaly kladné a záporné odchylky). -5,3 pr ůměr = 10,3-3,3 +6,7-1,8 +3,7 27 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

ROZPTYL pro základní soubor: pro výběrový soubor: 2 σ = var X = N ( x ) 2 j µ ( x ) 2 j x j= 1 N S 2 = var X = n j= 1 n 1 pro tříděný soubor: 28 S 2 = m i= 1 n i ( x x) i N 2

SMĚRODATNÁ ODCHYLKA je odmocnina z rozptylu. Rozměr směrodatné odchylky je stejný jako rozměr veličiny, což je její hlavní výhodou oproti rozptylu pro účely popisné statistiky, jinak směrodatná odchylka poskytuje stejnou informaci o variabilitě souboru jako rozptyl průměrnou odchylku hodnot od střední hodnoty. 29

VARIAČNÍ KOEFICIENT je relativní mírou variability a používá se k vzájemnému porovnávání variability různých souborů. S% = S x 100 K porovnávání variability různých souborů je vždy nutné použít variační koeficient, především pro soubory používající různé jednotky nebo mající hodnoty v různých řádech (např. jednotky a tisíce))!! 30

VARIAČNÍ KOEFICIENT Příklad: Který ze dvou zadaných souborů má vyšší variabilitu? 1. soubor 2. soubor x = 3 cm, S = 3,1cm x = 150 cm, S = 75cm Pouhým srovnáním směrodatných odchylek (S) dospějeme k závěru, že vyšší variabilitu má 2.soubor, protože jeho S je výrazně vyšší Porovnání pomocí variačního koeficientu: S 3,1 S 75 S% = 100 = 100 = 103, 3% S% = 100 = 100 = 50% x 3 x 150 31 Využitím S% zjistíme, že vyšší variabilitu (tj. více rozptýlené hodnoty souboru) má 1. soubor, protože průměrná odchylka měřené hodnoty od průměru je více než 100 % hodnoty průměru, zatímco u 2. souboru je to pouze 50 % jeho hodnoty

KVANTILOVÉ MÍRY VARIABILITY 32 Kvantilové odchylky jsou horší mírou variability než momentové charakteristiky. Používají se tam, kde nelze použít momentové charakteristiky (silně nenormální rozdělení, výskyt extrémních hodnot, apod.) Kvartilová odchylka: Q = Interkvartilové rozpětí: ( ) + ( ) x~ R = x x F x~ 2 x~ x~ 75 25 x~ 75 25 75 = 2 x~ 25

CHARAKTERISTIKY TVARU měří odchylku v rozložení četností hodnot oproti danému referenčnímu rozdělení četností (obvykle normálnímu): Skládá se ze dvou složek: nesouměrnosti (šikmosti, asymetrie) špičatosti (zahrocenosti, excesu) 33

NESOUMĚRNOST se projevuje tím, že v souboru je více hodnot menších než větších ve srovnání se střední hodnotou (levostranná nesouměrnost) nebo více hodnot větších než menších ve srovnání se střední hodnotou (pravostranná nesouměrnost). 34 100 90 80 70 60 50 40 30 20 10 0 10 12 14 16 18 20 22 24 26 28 30

NESOUMĚRNOST měříme koeficientem nesouměrnosti A = N ( x ) 3 j x n ( ) 3 i xi x j= 1 n S 3 A = m i= 1 n S A > 0 A = 0 A < 0 3 35

NESOUMĚRNOST Souměrné rozdělení: A = 0 36 Průměr = medián = modus

NESOUMĚRNOST Levostranné (doprava sešikmené) rozdělení 37 modus medián průměr

NESOUMĚRNOST Pravostranné (doleva sešikmené) rozdělení A < 0 38 průměr medián modus

ŠPIČATOST 39 je mírou koncentrace dat kolem určité hodnoty nebo skupiny hodnot ve srovnání s určitým definovaným rozdělením veličiny (např. normálním). Rozlišujeme rozdělení: ploché koncentrace dat kolem určité hodnoty je NIŽŠÍ než odpovídá definovanému rozdělení (tedy četnosti kolem této hodnoty jsou nižší) špičaté - koncentrace dat kolem určité hodnoty je VYŠŠÍ než odpovídá definovanému rozdělení(tedy četnosti kolem této hodnoty jsou vyšší) odpovídající danému definovanému rozdělení (např. normální)

40 ŠPIČATOST

ŠPIČATOST 41 E Mírou špičatosti je koeficient špičatosti: = N ( x µ ) 4 j ni( xi x) j= 1 i= 1 [ ] E = [ ] N σ 4 3 vzorec pro netříděný soubor m n S vzorec pro tříděný soubor Pro normální rozdělení platí: E = 0 (3) normálně zahrocené E < 0 (3) ploché E > 0 (3) špičaté 4 4 3 Každé modelové (matematicky definované) rozdělení má vlastní hodnotu špičatosti. Normální rozdělení má hodnotu 3. Pokud srovnáváme špičatost experimentálního rozdělení s rozdělením normálním a pro výpočet E použijeme pouze černou část vzorce, potom se výsledná hodnota srovnává s hodnotou 3. Pokud se ještě odečte tato hodnota, která je pro každé modelové rozdělení jiná červené číslo v hranaté závorce - potom se hodnota E srovnává s hodnotou 0 to je častější případ a platí v Excelu i v programu Statistika.