6. P o p i s n á s t a t i s t i k a

Podobné dokumenty
11. P o p i s n á s t a t i s t i k a

7. P o p i s n á s t a t i s t i k a

Deskriptivní statistika 1

11. Popisná statistika

12. N á h o d n ý v ý b ě r

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

P2: Statistické zpracování dat

Pravděpodobnost a aplikovaná statistika

13 Popisná statistika

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

Popisná statistika. Zdeněk Janák 9. prosince 2007

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

Odhady parametrů 1. Odhady parametrů

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Náhodný výběr 1. Náhodný výběr

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

z možností, jak tuto veličinu charakterizovat, je určit součet

14. B o d o v é o d h a d y p a r a m e t r ů

vají statistické metody v biomedicíně

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

Statistika pro metrologii

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti

Pravděpodobnostní modely

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Elementární zpracování statistického souboru

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

6. Posloupnosti a jejich limity, řady

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Intervalové odhady parametrů některých rozdělení.

1. K o m b i n a t o r i k a

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

Intervalové odhady parametrů

4. B o d o v é o d h a d y p a r a m e t r ů

MATICOVÉ HRY MATICOVÝCH HER

2 STEJNORODOST BETONU KONSTRUKCE

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

4.2 Elementární statistické zpracování Rozdělení četností

8. Základy statistiky. 8.1 Statistický soubor

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

8. Analýza rozptylu.

PRAVDĚPODOBNOST A STATISTIKA

2. Náhodná veličina. je konečná nebo spočetná množina;

Komplexní čísla. Definice komplexních čísel

3. Lineární diferenciální rovnice úvod do teorie

Závislost slovních znaků

(Teorie statistiky a aplikace v programovacím jazyce Visual Basic for Applications)

DIFERENCIÁLNÍ POČET FUNKCE JEDNÉ PROMĚNNÉ. 1) Pojem funkce, graf funkce

V. Normální rozdělení

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

2 EXPLORATORNÍ ANALÝZA

Funkce. RNDr. Yvetta Bartáková. Gymnázium, SOŠ a VOŠ Ledeč nad Sázavou

Doc. Ing. Dagmar Blatná, CSc.

10.3 GEOMERTICKÝ PRŮMĚR

Matematika 1. Ivana Pultarová Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D Posloupnosti

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Kapitola 5 - Matice (nad tělesem)

n-rozměrné normální rozdělení pravděpodobnosti

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Pravděpodobnostní model doby setrvání ministra školství ve funkci

Matematika I, část II

3. Charakteristiky a parametry náhodných veličin

Definice obecné mocniny

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika

n=1 ( Re an ) 2 + ( Im a n ) 2 = 0 Im a n = Im a a n definujeme předpisem: n=1 N a n = a 1 + a a N. n=1

Úloha III.S... limitní

Správnost vztahu plyne z věty o rovnosti úhlů s rameny na sebe kolmými (obr. 13).

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

17. Statistické hypotézy parametrické testy

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

1 ROVNOMĚRNOST BETONU KONSTRUKCE

Obsah. 1 Mocninné řady Definice a vlastnosti mocninných řad Rozvoj funkce do mocninné řady Aplikace mocninných řad...

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika

2.4. INVERZNÍ MATICE

STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6

1.1. Definice Reálným vektorovým prostorem nazýváme množinu V, pro jejíž prvky jsou definovány operace sčítání + :V V V a násobení skalárem : R V V

je konvergentní, právě když existuje číslo a R tak, že pro všechna přirozená <. Číslu a říkáme limita posloupnosti ( ) n n 1 n n n

Zhodnocení přesnosti měření

Petr Šedivý Šedivá matematika

Posloupnosti a číselné řady. n + 1. n n n n. n n n. = lim. n2 sin n! lim. = 0, je lim. lim. lim. 1 + b + b b n) = 1 b

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Kvantová a statistická fyzika 2 (Termodynamika a statistická fyzika)

je konvergentní, právě když existuje číslo a R tak, že pro všechna přirozená <. Číslu a říkáme limita posloupnosti ( ) n n 1 n n n

Mod(x) = 2, Med(x) = = 2

STATISTIKA PRO EKONOMY

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

Spojitost a limita funkcí jedné reálné proměnné

Přednáška 7, 14. listopadu 2014

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Mendelova univerzita v Brně Statistika projekt

Vlastnosti posloupností

8. Odhady parametrů rozdělení pravděpodobnosti

Transkript:

6. P o p i s á s t a t i s t i k a 6.. Pozámka: Při statistickém zkoumáí ás zajímají hromadé jevy a procesy, u kterých zkoumáme zákoitosti, které se projevují u velkého počtu prvků. Prvky zkoumáí azýváme statistické jedotky. Při zkoumáí používáme dva základí druhy statistiky, popisou statistiku a iterferečí statistiku. Popisá statistika zjišťuje a sumarizuje iformace, zpracovává je ve formě grafů a tabulek a vypočítává jejich číselé charakteristiky jako průměr, rozptyl percetily, rozpětí a pod. Iterferečí statistika čií závěry a základě dat získaých z šetřeí provedeých pro vybraý soubor respodetů. Aalyzuje tyto závěry a predikuje z ich závěr pro celý soubor. (Volebí průzkum a pod.) Při statistickém šetřeí máme k dispozici: - základí soubor je soubor všech statistických jedotek; - výběrový soubor je vybraá část ze základího souboru. Rozsah základího (výběrového) souboru je počet jedotek v souboru. Při vytvářeí souboru jedotek provádíme výběr ve tvaru prostého áhodého výběru. 6.2. Defiice: Prostý áhodý výběr je áhodý výběr ze základího souboru vytvořeý tak, že každá statistická jedotka ze základího souboru má stejou pravděpodobost, že bude vybráa. Pokud je možé vybrat tutéž jedotku zova, mluvíme o výběru s vraceím, pokud opakovaý výběr eí možý jedá se o výběr bez vraceí. Pozámka: Jié metody výběru požívají defiovaý způsob výběru, který je posá zadaým algoritmem. Využívá se především tvrba výběru s meším rozsahem, který by podchycoval zákoitosti obsažeé v rozsáhlejším výběru. Popisá statistika Vlastosti statistických jedotek, které se pro jedotlivé jedotky měí azýváme statistické zaky příp. proměé ebo veličiy. Vyskytují se veličiy - kvatitativí, popsaé číselou hodotou (výška, váha, cea); - kvalitativí, popsaé vlastostmi (muž, žea, barva očí, dosažeé vzděláí). Kvalitativí veličiy mohou být diskrétí, abývající hodot ze zadaé koečé možiy, ebo spojité, které abývají hodot ze zadaého itervalu. Pozorovaím ebo měřeím hodot zkoumaé veličiy e ěkolika statistických jedotkách získáme vstupí data. Soubor těchto údajů azýváme datový soubor. Teto soubor je jedorozměrý, jestliže sledujeme jede zak, ebo vícerozměrý, pokud sledujeme více zaků. Při zpracováí datového souboru kvatitativích dat x, x 2,..., x potřebujeme pro ěkterá šetřeí data uspořádat podle velikosti. Dostaeme pak datový soubor tvaru x () x (2)... x (), kde x () = mi{x i ; i } a x () = max{x i ; i }. Metody zpracovaí dat 6.3. Tříděí dat je rozděleí dat do skupi provedeé tak, aby vyikly charakteristické vlastosti sledovaých jevů. Uspořádáme a zhustíme data do přehledější formy. Rozezáváme - jedostupňové tříděí, jestliže třídíme data podle změ jedoho statistického zaku; 67

- vícestupňové tříděí, pokud provádíme tříděí podle více zaků ajedou. Nejčastěji při jedostupňovém tříděí kvatitativích dat uspořádáme data podle velikosti a staovíme itervaly, které odpovídají jedotlivým třídám. Mluvíme pak o itervalovém tříděí. Máme-li datový soubor {x, x 2,..., x }, který obsahuje celkem prvků, pak iterval mezi ejvětší a ejmeší hodotou rozdělíme a k disjuktích itervalů, tříd, tvaru (a i, a i. Potom prvek x j patří do i té třídy, pokud je a i < x j a i. Používáme ásledujících termíů a ozačeí: - třída je část dat zařazeá do jedé skupiy, třídy, iterval (a i, a i ; - dolí hraice třídy je ejmeší hodota, při které prvek do třídy patří, hodota a i ; - horí hraice třídy je ejvětší hodota, při které prvek do třídy patří, hodota a i ; - střed třídy je průměr horí a dolí hraice třídy, y i = 2 (a i + a i ); - šířka třídy je rozdíl horí a dolí hraice třídy, hodota a i a i ; - (absolutí) četost třídy i je počet prvků souboru, které patří do třídy; - relativí četost p i = i je poměr četosti třídy ku celkovému počtu dat; - kumulativí (absolutí) četost N i = + 2 +... + i je součet četostí třídy a četostí tříd předchozích; - kumulativí relativí četost P i = p + p 2 +... + p i je součet relativích četostí třídy a relativích četostí tříd předchozích. Potom platí: k i =, k p i =, i j = N i, j= i p j = P i, N k = a P k =. j= Při staoveí hraic tříd obvykle zachováváme tato dvě pravidla: - šířku třídy h volíme pro všechy itervaly shodou, s vyjímkou krajích tříd pokud tvoří eomezeé itervaly: - při staoveí šířky třídy h dodržujeme Sturgesovo pravidlo, kdy pro počet tříd k platí, že k. = + 3, 3 log. 5 0 20 40 50 00 200 000 k 3 4 5 6 7 8 9 - pokud jsou krají itervaly děleí eomezeé, pak za střed prví, resp. posledí třídy volíme bod, který má od koečého krajího bodu třídy stejou vzdáleost jakou má od středu sousedí třídy. Při tříděí kvalitativích dat postupujeme obdobě. Jeom místo itervalu tvoří třídu prvky, které mají stejý zak, ebo skupiu zaků. 6.4. Grafická zázorěí Pro větší ázorost požíváme místo tabulek zázorěí tříděí pomocí grafů. Používá se ěkolika typů. Histogram je graf kdy a vodorovou osu zázoríme třídy a a svislou osu četosti či relativí četosti. Často se používá ve tvaru, kdy se hodota odpovídající třídě zázorí jako sloupec s itervalem třídy jako základou a výška je dáa četostí. Polygo četostí a relativích četostí je graf, kdy úsečkami spojíme body (y i, i ), resp. (y i, p i ). 68

Bodový graf dostaeme tak, že a vodorovou osu vyeseme třídy jako body i, i k, a ve svislém směru vyášíme jedotlivé prvky třídy zázorěé jako jedotlivé body (i, j), j =, 2,... i. Sloupkový graf je podobý histogramu, ale sloupce bývají odděleé, mají stejou šířku a každý sloupec odpovídá jedé třídě. Používáme je předeším u kvalitativích dat. Kruhový (výsečový) diagram je zázorěí pomocí výsečí kruhu, kde každé třídě odpovídá jeda výseč. Velikosti obsahů výsečí odpovídají četostem třídy. Stem-ad-Leaf diagram je uspořádáí dat do tabulky, kdy prví sloupec -stem=stoek odpovídá třídě a do řádku -leaf=list vypisujeme prvky třídy. Pokud tyto prvky uspořádáme podle velikosti mluvíme o uspořádaém diagramu. 6.5. Příklad: Ze 7 možých výsledků jsme dostali datový soubor o 4 datech i 2 3 4 5 6 7 8 9 0 2 3 4 x i 2 3 2 5 2 7 4 5 4 2 5 Tab. 6.. Datům odpovídá tabulka četostí Tab. 6.2 a bodový graf a obrázku Obr. 6.. třída 2 3 4 5 6 7 četost 3 4 2 3 0 4 3 2 2 3 4 5 6 7 i Tab. 6.2. Obr. 6.. Polygo četostí k tabulce Tab 6.2. Histogram četostí k tabulce 6.2. 4 3 2 4 3 2 2 3 4 5 6 7 i Obr. 6.2. Obr. 6.3. Sloupkový graf k tabulce Tab. 6.2. 2 3 4 5 6 7 i 4 3 2 2 3 4 5 6 7 i Obr. 6.4. 69

Řada vlastostí datového souboru se dá vyčíst z tvaru histograu či polygou četostí. Ty odpovídají grafu hustoty u rozděleí pravděpodobosti áhodé veličiy. Rozlišuje se ěkolik charakteristických průběhů těchto grafů. - souměrý ve tvaru zvou, trojúhelíku či rovoměrý; - esouměré ve tvaru J, obráceého J, vpravo či vlevo protažeé; - podle počtu vrcholů jedo-, dvou-, či vícevrcholové. 6.6. Charakteristiky (míry) polohy. Nejzámější a ejčastěji používaou charakteristkou polohy je aritmetický průměr hodot souboru. Průměr datového souboru {x, x 2,..., x } je defiová vztahem x = x k. Pokud jsou {z, z k,..., z m } růzé hodoty souboru s četostmi j, j =, 2,..., m, a s relativími četostmi p j, pak k= x = m m z j j = z j p j. j= j= Věta. Vlastosti průměru Pro průměr datového souboru platí:. Součet odchylek hodot souboru od průměru je rove ule, t.j. (x i x) = 0. 2. Přičteme-li k hodotám souboru kostatu a, pak průměr ového souboru (x i + a) = x + a. 3. Násobíme-li hodoty souboru číslem b, ásobí se průměr také b. Průměr datového souboru je citlivý a hrubé chyby, kdy jeda chybá hodota může výrazě změit hodotu průměru. Používámě ěkdy tzv. robustích charakteristik, které jsou méě citlivé a zadáí chybé hodoty. Mezi ě patří mediá x, který je pro datový soubor x, x 2,... x defiová vztahem x = 2 x (m), ) pro = 2m, (x (m) + x (m+), pro = 2m. Další z robustích charakteristik je modus ˆx, který je defiová jako hodota souboru s ejvětší četostí, tedy ˆx = z j, j i, i m. Pozameejme, že modus emusí být jedozačě urče, může abývat ěklika hodot. Pro podrobější popis rozděleí hodot datového souboru používáme kvatily. Kvatil datového souboru rozděluje soubor a dvě části. V jedé jsou hodoty souboru, které jsou meší či ejvýše rovy kvatilu a ve druhé jsou hodoty větší ež kvatil. Defiujeme pro p, 0 < p <, p kvatil, resp. 00p%kvatil, jako tu hodotu x 00p ze souboru {x, x 2,..., x }, pro kterou je přibližě 00p% hodot ze souboru meších a 00( p)% hodot je větších ež x 00p. Nejjemější používaé rozděleí souboru je pomocí percetilů x, x 2,..., x 99. Často se využívají decily x 0, x 20,..., x 90. Speciálí ázvy mají kvatily: - x 50 je mediá; - x 25 dolí kvartil; - x 75 horí kvartil. Jako mezikvartilové rozpětí se defiuje rozdíl x 75 x 25. 70

Jsou-li x () x (2)... x () hodoty souboru uspořádaé podle velikosti pak 00p% kvatil určíme podle vzorce x x 00p = ([p]+), pokud p eí celé číslo, 2 (x (p) + x (p)+ ) pro p celé, kde [p] je celá část čísla, tedy celé číslo, které je ejbližší meší. Jié průměrové charakteristiky polohy. Pro ěkteré soubory dat používáme jié průměry. Jsou to: Geometrický průměr x G, který je pro soubor x, x 2,..., x kladých dat defiová vztahem x g = x x 2... x. Pro taková data popisují hodoty i = x x 0, i 2 = x 2 x,..., i = x x, x 0 =, přírůstek, apř. v ekoomice ročí árust produkce, ce a pod. Je pak x k = x 0 i i 2... i k a x = x 0 (i G ). Věta 2. Pro soubor s kladými daty je x G x a rovost astae jediě pro x = x 2 =... = x. Důkaz: Fukce f(x) = l x je kovexí a tedy pro x a h je f(x) f(h) + f (h)(x h). Jestliže zvolíme x = x i a h = x, pak pro i platí erovice ( ) l x i l x + (x i x)f (x). Sečteím dostaeme erovici protože podle věty je (x i x) = 0. Dále je Je tedy l x i l x + f (x) (x i x) = l x, l x G = l( x x 2... x ) = l x i. l x G l x x G x, eboť je fukce l x rostoucí. Rovost ve vztahu ( ) astae jediě pro x i = x, tedy pokud je x = x 2 =... = x. Harmoický průměr x H, který je pro soubor kladých dat defiová vztahem x H = x + x 2 +... + x. Pozámka: Využívá se, kde má vypovídací hodotu převráceá hodota k původí. Nejčastěji je to v případech, kdy hodota x i odpovídá době uté k provedeí ějakého 7

pracovího úkou. Převráceá hodota pak uvádí, jakou část pracovího úkou je splěa za jedotku času. Věta 3. Pro soubor s kladými daty je x H x G x, přičmž rovost astae pouze pro x = x 2 =... = x. Důkaz: Z defiice harmoického průměru vyplývá vztah x H = x i. což je aritmetický průměr souboru x i. Podle věty 2 je ale x H = x x x 2 2... x = i Rovost platí pouze v případě, že x = x 2 =... = x. Kvadratický průměr x K je defiová vztahem x K = x 2 i. = x H x G. x x 2... x x G Věta 4. Je x x K a rovost platí poze v případě, že x = x 2 =... x. Důkaz: Fukce f(x) = x 2 je kokáví a tedy je x 2 h 2 + f (h)(x h). Jestliže položíme x = x i a h = x, pak x 2 i (x) 2 + f (x)(x i x) x 2 i (x) 2 + f (x)(x i x) (x K ) 2 (x) 2 x K x. Rovost astae pouze pro x i = x, tedy pro x = x 2 =... = x. Věta 5. Pro soubory kladých dat je x () x H x G x x K x () a rovost astae pouze v případě, že x = x 2 =... = x. 6.7. Charakteristiky (míry) rozptýleosti. Rozpětí datového souboru je hodota R = x max x mi. Je to hodota, která se sado spočítá, ale její hodota je citlivá a extrémí hodoty. Vychází pouze ze dvou hodot a igoruje iformaci z ostatích hodot souboru. V ěkterých případech používáme jako charakteristiku tohoto druhu hodotu x 90 x 0. Současě provedeme ořezáí souboru, kde vyecháme hodoty meší ež x 0 a větší ež x 90. Odstraíme tím případé extrémí hodoty, které mohou být způsobey jiými vlivy. Podobou charakteristikou je mezikvartilové rozpětí IQR = x 75 x 25. Výběrový rozptyl je průměr čtverců odchylek od průměru a je defiová vztahem s 2 = (x i x) 2. 72

Hodotu s azýváme výběrovou směrodatou odchylkou. Věta 6. Vlastosti rozptylu a vzorec pro výpočet.. Je s 2 = (x i x) 2 = x 2 i 2x x i + (x) 2 = x 2 i 2x x i + x x i = = x 2 i (x) 2 s 2 = x 2 i (x) 2. 2. Je-li y i = bx i + a, i, pak s 2 y = b 2 s 2 x, s y = b s x. Věta 7. Fukce S(a) = (x i a) 2 abývá svého miima s 2 pro a = x. Důkaz: Je S (a) = 2(x i a)( ) = 0 (x i a) = 0 x = a. Pomocé tvrzeí: Pro tice čísel (a, a 2,..., a k ) a (b, b 2,..., b k ) je ( k ) 2 ( k ) ( k ) a i b i a 2 i b 2 i. Jestliže iterpretujeme tice čísel jako aritmetické vektory v R k, pak lze uvedeou erovici přepsat do tvaru ( a. b) 2 a 2. b 2. Ta ale platí, eboť pro skarálí souči dvou vektorů je a. b = a. b. cos ( a, b). Protože je fukce kosius omezeá jedičkou, uvedeá erovice platí. Věta 8. Pro soubor x i, i platí max{ x i x ; i } s. Důkaz: Položme v tvrzeí pomocé věty a = (x x,..., x i x, x i+ x,..., x x) a b = (,,..., ). Potom je Protože je 2 j x) ( ) j i(x j x) j i(x 2 = ( ) (x j x) 2 (x i x) 2. j= tak z předchozí erovice vyplývá, že j=(x j x) = 0 (x i x) = j i (x j x) (x i x) 2 ( ) (x j x) 2 ( )(x i x) 2 (x i x) 2 (x j x) 2 = ( )s 2. j= j= Odmocěím získáme dokazovaou erovici. Tato erovice platí pro všechy hodoty i, i, platí tudíž i pro jejich maximum. 73

Věta 9. Pro variačí rozpětí souboru platí s 2 R2 4. Důkaz: Ozačme m = 2 (x () + x () ). Je tedy x i x R 2. Fukce S(a) z věty 7 abývá svého miima pro a = x a tedy je s 2 = S(x) S(m) = (x i m) 2 R2 4. Variačí koeficiet je defiová vztahem V = s x. Je-li V > 0, 5 pak se jedá o esourodý soubor. Pozameejme, že soubory x i a bx i mají stejý variáčí koeficiet. Pětičíselá charakteristika souboru je pětice čísel x mi, x 25, x 50, x 75, x max. Průměrá odchylka d a od bodu a je pro soubor dat x i defiováa vztahem d a = x i a. Nejčastěji se používá průměrá odchylka od aritmetického průměru x ebo mediáu x. K tomu ás vede ásledující vlastost. Věta 0. Fukce d a abývá svého miima pro mediá a = x. Důkaz: Je-li a < x (), pak je d a = (x i a) = x a, tedy d (a) = a tudíž je fukce d a klesající v itervalu (, x (). Obdobě pro a > x () je d a = a x, tedy d (a) = a tudíž je fukce d a rostoucí v itervalu (x (), ). Nechť je x (j) < a < x (j+) pro ějaké j. Potom je d a = (a x (i) ) + (x (i) a). Je tedy i=j+ d (a) = 2j (j + ( j)( )) =. Derivace je záporá a tedy fukce je klesající pro 2j < 0 j < 2 a derivace je kladá, tedy fukce je rostoucí pro 2j > 0 j > 2. Je-li sudé číslo, pak je fukce d a kostatí a itervalu (x ( 2 ), x ( 2 +), a to je její miimum. Předěl mootoie je ovšem mediá x. Jako dalši charakteristiky používáme: koeficiet šikmosti A 3 = s 3 (x i x) 3 a koeficiet špičatosti A 4 = s 4 (x i x) 4 3 Pro data, která jsou rozložea symetricky kolem hodoty x je A 3 = 0. Hodoty A 3 blízké ule odpovídají rozděleí, které se blíží symetrickému. Je-li A 3 > 0, pak je rozložeí 74

dat sešikmeé vpravo, ižší hodoty jsou více ahuštěy ež velké hodoty. Pro A 3 < 0 je rozděleí sešikmeé vlevo, větší hodoty jsou více ahuštěy ež ižší hodoty. Je-li A 4 blízké ule, říkáme, že jedá o soubor s ormálí špičatostí. Při A 4 < 0 mluvíme osouborech plochých a při A 4 > 0 mluvíme o souborech špičatých. Příklad: Uvedeme výpočty uváděých charakteristik pro soubor dat z tabulky Tab. 6.. Je x = 4 44 = 3, 43, R = 7 = 6 a s2 = 3, 565, s =, 875. Pro kvatily dostaeme: x 0 = x 2 =, x 90 = x 3 = 5, x 50 = x 3 = 5, x 25 = x 4 = 2, x 75 = x = 5. Mezikvartilové rozpětí IQR = x 75 x 25 = 5 2 = 3. Variačí koeficiet V = s, 875 = = 0, 597. x 3, 43 75