POPISNÁ STATISTIKA. Předmět popisné statistiky

Podobné dokumenty
5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Mendelova univerzita v Brně Statistika projekt

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

4.2 Elementární statistické zpracování Rozdělení četností

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

LABORATORNÍ CVIČENÍ Z FYZIKY. Měření objemu tuhých těles přímou metodou

[ jednotky ] Chyby měření

11. Popisná statistika

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Doc. Ing. Dagmar Blatná, CSc.

Metody zkoumání závislosti numerických proměnných

S1P Popisná statistika. Popisná statistika. Libor Žák

U. Jestliže lineární zobrazení Df x n n

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

Generování dvojrozměrných rozdělení pomocí copulí

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

P1: Úvod do experimentálních metod

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

Deskriptivní statistika 1

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

1.1 Definice a základní pojmy

Náhodné jevy, jevové pole, pravděpodobnost

Chyby přímých měření. Úvod

a další charakteristikou je četnost výběrového souboru n.

12. N á h o d n ý v ý b ě r

VY_52_INOVACE_J 05 01

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

P2: Statistické zpracování dat

8. Zákony velkých čísel

, jsou naměřené a vypočtené hodnoty závisle

1.3. ORTOGONÁLNÍ A ORTONORMÁLNÍ BÁZE

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

11. Časové řady Pojem a klasifikace časových řad

PRAVDĚPODOBNOST A STATISTIKA

1. Základy měření neelektrických veličin

SOUKROMÁ VYSOKÁ ŠKOLA EKONOMICKÁ ZNOJMO. Statistika I. distanční studijní opora. Milan Křápek

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

Úvod do korelační a regresní analýzy

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

12. Neparametrické hypotézy

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2

PRAVDĚPODOBNOST A STATISTIKA

9. Měření závislostí ve statistice Pevná a volná závislost

Elementární zpracování statistického souboru

Spolehlivost a diagnostika

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

ZÁKLADY PRAVDĚPODOBNOSTI A STATISTIKY

Univerzita Karlova v Praze Pedagogická fakulta

3. Lineární diferenciální rovnice úvod do teorie

APLIKOVANÁ STATISTIKA

O Jensenově nerovnosti

MATEMATICKÁ INDUKCE. 1. Princip matematické indukce

Odhady parametrů 1. Odhady parametrů

6. Posloupnosti a jejich limity, řady

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Úvod do teorie měření

Přednáška č. 2 náhodné veličiny

Lineární regrese ( ) 2

Intervalové odhady parametrů některých rozdělení.

Komplexní čísla. Definice komplexních čísel

Testování statistických hypotéz

USTÁLENÉ PROUDĚNÍ V OTEVŘENÝCH KORYTECH

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

BIVŠ. Pravděpodobnost a statistika

Přednáška V. Úvod do teorie odhadu. Pojmy a principy teorie odhadu Nestranné odhady Metoda maximální věrohodnosti Průměr vs.

Spojitost a limita funkcí jedné reálné proměnné

FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

8.2.1 Aritmetická posloupnost I

7 LIMITNÍ VĚTY. Čas ke studiu kapitoly: 70 minut. Cíl:

Pravděpodobnostní modely

Matematika I, část II

TĚŽIŠTĚ A STABILITA. Těžiště tělesa = bod, kterým stále prochází výslednice tíhových sil všech jeho hmotných bodů, ať těleso natáčíme jakkoli

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

8.2.1 Aritmetická posloupnost

13 Popisná statistika

Chyby měření: 1. hrubé chyby - nepozornost, omyl, únava pozorovatele... - významně převyšuje rozptyl náhodné chyby 2. systematické chyby - chybné

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

T e c h n i c k á z p r á v a. Pokyn pro vyhodnocení nejistoty měření výsledků kvantitativních zkoušek. Technická zpráva č.

Pravděpodobnost a aplikovaná statistika

Úvod do zpracování měření

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

1 EXPLORATORNÍ ANALÝZA PROMĚNNÝCH. Čas ke studiu kapitoly: 120 minut. Cíl: Po prostudování této kapitoly budete umět použít

Kapitola 5 - Matice (nad tělesem)

ZÁKLADY STAVEBNÍ MECHANIKY

PRAVDĚPODOBNOST A STATISTIKA

Téma 6: Indexy a diference

STATISTICKÉ MINIMUM PRO STUDENTY BAKALÁŘSKÉHO STUDIA NA TECHNICKÝCH OBORECH BOHUMIL MINAŘÍK

2. Vícekriteriální a cílové programování

Optimalizace portfolia

Základy statistiky. Petr Kladivo

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

Mod(x) = 2, Med(x) = = 2

Transkript:

POPISNÁ Předmět popsé statstky Hromadá data a áhodé velčy Představte s, že potřebujete zjstt podrobé a kompleí formace o určtém souboru objektů, jedců č událostí (stromech v lese, ldech ve městě, broucích a mez, mravecích v mravešt, výrobcích z určté dodávky, ehodách a slcích, povodích a řekách apod) Za tím účelem zpravdla zjšťujeme č měříme vytypovaé charakterstcky jedotlvých objektů, a tak obdržíme tzv hromadá data V klascké statstcké termolog se popsovaé objekty azývají statstcké jedotky, zjšťovaým charakterstkám se říká statstcké zaky, o vyšetřovaém souboru objektů pak mluvíme jako o statstckém (č datovém) souboru Hromadá data tedy vzkají měřeím jstých statstckých zaků a jedotkách ějakého statstckého souboru Statstckým zakem může být apříklad tloušťka stromu, hmotost člověka, délka krovek brouka č počet ehod v jstém úseku slce Tyto zaky mají promělvý charakter a pro růzé objekty z daého statstckého souboru abývají růzých hodot V teor pravděpodobost mluvíme proto o statstckých zacích jako o áhodých velčách Neí tomu ovšem tak, že by áhodé velčy abývaly svých hodot zcela ahodle a epodléhaly ějakému řádu; ve skutečost se všechy hodoty vyskytují s jstým pravděpodobostm charakterzujícím daou velču Byla-l tedy hromadá data získáa změřeím hodot jstého statstckého zaku a jedotkách ějakého statstckého souboru, lze očekávat, že více pravděpodobé hodoty se budou v těchto datech objevovat s větší četostí (frekvecí) ež hodoty méě pravděpodobé Základím úkolem popsé statstky přtom je: () určt tyto četost a prezetovat je ve formě přehledé tabulky č dagramu, () ahradt zpravdla velké možství hromadých dat malým počtem ukazatelů vysthujících ěkteré charakterstcké vlastost dat; takovým ukazatelům se též říká statstky Dskrétí a spojté áhodé velčy Řekeme, že áhodá velča je dskrétí, abývá-l pouze koečě ebo spočetě moha hodot Spojté velčy jsou pak takové, které mohou abývat všech hodot z ějakého tervalu Příkladem dskrétí áhodé velčy je počet ššek a stromu, počet roztočů a lstu jabloě, počet ehod v roce č výsledek hodu hrací kostkou Příkladem spojté áhodé velčy je pak tloušťka č výška stromu, délka krovek brouka, hmotost

POPISNÁ člověka č věk, kterého se teto člověk dožje apod Jak uvdíme dále, techky používaé př prezetac a charakterzac hromadých dat se poěkud lší dle toho, byla-l tato data získáa změřeím hodot velč dskrétích č spojtých Prezetace hromadých dat Budeme yí lustrovat rozlčé způsoby prezetace hromadých dat a třech příkladech V prvých dvou příkladech budeme prezetovat data, která byla získáa měřeím hodot dskrétí áhodé velčy (totž výsledky hodů hrací kostkou a počet roztočů a lstech jabloě), ve třetím pak data, která byla získáa měřeím hodot spojté áhodé velčy (tloušťky stromů) 3 Příklad (výsledky hodů hrací kostkou) Následující posloupost čísel představuje výsledky sére sto dvacet hodů hrací kostkou: 5 6 4 3 4 3 6 3 3 6 6 4 6 5 6 3 3 3 3 3 6 3 5 6 6 6 6 5 5 6 4 5 5 3 3 3 3 6 4 4 3 4 4 3 3 4 6 5 5 3 4 3 5 4 4 4 4 4 3 4 6 4 6 5 4 5 3 5 3 5 5 3 5 3 6 4 5 6 Jde o hromadá data, která byla získáa zazameáím výsledků jedotlvých hodů Výsledek hodu je dskrétí áhodou velčou, která abývá pouze koečě moha hodot; totž hodot z možy {,, 3, 4, 5, 6} Četost výskytu jedotlvých hodot v sér jsou zazameáy v ásledující tabulce: TAB Tabulka četostí Výsledek hodu 3 4 5 6 Četost 7 5 4 9 7 8 Uvědomte s přtom trválí skutečost, že součet všech četostí je rove počtu dat (hodů) Vyjádříme-l četost možých výsledků relatvě, obdržíme tabulku relatvích četostí, tj četostí děleých počtem dat TAB Tabulka relatvích četostí Výsledek hodu 3 4 5 6 Relatví četost 0,4 0,08 0,00 0,58 0,4 0,50 Vzhledem k tomu, že součet všech četostí je rove počtu dat, je součet všech relatvích četostí rove jedé

3 Někdy se relatví četost vyjadřují v procetech (vz ásledující tabulka) TAB 3 Tabulka relatvích četostí (%) Výsledek hodu 3 4 5 6 Relatví četost (%) 4, 0,8 0,0 5,8 4, 5,0 Sezam (relatvích) četostí zachyceý v předchozích tabulkách se azývá též rozděleím (relatvích) četostí Rozděleí četostí lze zázort též grafcky, apříklad tzv tyčkovým dagramem (vz obr ) 30 5 0 Četost 5 0 5 0 3 4 5 6 Výsledek hodu Obr Tyčkový dagram Tyčkový dagram vysthuje velm ázorě relatví rozdíly mez četostm jedotlvých hodot; přtom je relevatí, zda jde o dagram četostí č dagram četostí relatvích 4 Příklad (počet roztočů a jabloňových lstech) V ásledující tabulce je zazameáo rozděleí počtu roztočů a sto padesát jabloňových lstech Počet roztočů a lstu 0 3 4 5 6 7 8 a více Počet lstů s daým počtem roztočů 70 38 7 0 9 3 0 Popsovaým statstckým jedotkam jsou lsty jabloě, zjšťovaým statstckým zakem je počet roztočů a lstu, četost výskytu určté hodoty tohoto zaku v datovém souboru tedy vyjadřuje počet lstů s daým počtem roztočů Počet roztočů a lstu je dskrétí áhodá velča, jejímž hodotam mohou být v prcpu

POPISNÁ 4 všecha ezáporá celá čísla 0,,, (praktcky lze totž je těžko staovt ějakou mez pro mamálí možý počet roztočů a jedom lstu) Moža hodot této velčy je tedy sce ekoečá, ale spočetá, což zameá, že lze její prvky očíslovat a seřadt do posloupost Tabulku tyčkový dagram četostí lze proto vytvořt podobě jako v případě, kdy je moža hodot zkoumaé áhodé velčy koečá s tím drobým rozdílem, že musíme sam rozhodout, u jaké hodoty sezam rozděleí četostí ukočíme (vz obr ) Počet lstů 80 70 60 50 40 30 0 0 0 0 3 4 5 6 7 8 9 0 Počet roztočů a lstu Obr Tyčkový dagram rozděleí počtu roztočů a lstech jabloě 5 Příklad (tloušťky stromů v porostu) Následující data jsou zázamem výčetích tlouštěk jedoho sta čtyřcetletých smrků stka (Tloušťky jsou měřey v mlmetrech) 04 98 76 76 8 4 06 0 3 09 6 67 38 4 34 39 3 7 69 36 4 46 04 7 06 63 60 54 0 8 83 06 6 63 8 9 0 00 90 33 44 8 79 5 0 9 48 44 0 34 48 3 49 90 8 40 96 4 08 37 70 80 4 0 4 07 08 40 89 0 89 0 56 87 0 9 6 60 34 7 4 47 9 74 94 98 50 4 9 8 54 4 9 4 79 93 Nyí se jedá o data, která byla získáa změřeím hodot spojtých áhodých velč, totž tlouštěk stromů Hodotam tlouštěk stromů mohou být všecha reálá čísla z určtého tervalu; moža těchto hodot je tedy ekoečá a avíc espočetá Budeme-l měřt tloušťky stromů velm přesě, pak se v získaém datovém souboru bude každá hodota vyskytovat pouze jedou Chceme-l tedy získat

5 ázorou představu o rozděleí četostí aměřeých tlouštěk, je třeba amísto četostí jedotlvých hodot určt četost výskytu těchto hodot v daém rozmezí (tervalu) Zvoleá soustava tervalů pak představuje tzv (tloušťkové) třídy Sam přtom určíme, jaké budou mít jedotlvé třídy meze Nejpřrozeější setříděí ašch dat obdržíme tak, že hodoty tlouštěk vyjádříme v cetmetrech a poté je zaokrouhlíme a celá čísla Jak řečeo, reálou osu rozdělíme a vzájemě dsjuktí třídí tervaly () (0,5;,5], (,5;,5], (,5; 3,5], a pro každý takový terval zazameáme četost stromů, jejchž tloušťka se v tomto tervalu achází Zastoupíme-l přtom každou třídu jejím středem, obdržíme ásledující tabulku četostí: Tloušťka (cm) 8 9 0 3 4 5 6 7 8 9 0 3 4 Četost 3 7 7 9 4 8 7 5 5 3 4 0 Aalogem tyčkového dagramu je yí tzv hstogram (vz obr 3) 6 4 0 Četost 8 6 4 0 0 4 6 8 0 4 6 8 0 4 6 8 30 Tloušťka Obr 3 Hstogram četostí Sloupce hstogramu hrají rol tyček v tyčkovém dagramu Počátek každého sloupce je totožý s dolí mezí příslušé třídy, koec sloupce pak s její mezí horí Sloupce tedy avazují jede a druhý, což ázorě vysthuje spojtost měřeých velč Namísto hstogramu se používá též polygo četostí (vz obr 4) Te je velce lustratví prezetací tvaru rozděleí četostí Specálě s povšměte, že převládají tloušťky průměré, zatímco stromů s výrazě podprůměrou č výrazě adprůměrou tloušťkou je velm málo

POPISNÁ 6 Já přrozeá soustava třídích tervalů je () (0,], (, ], (, 3], Ve srováí s tříděím () zůstala tedy zachováa délka tervalů, změl se ale počátek tříděí Odpovídající polygo četostí je a obr 5 6 4 0 Četost 8 6 4 0 0 4 6 8 0 4 6 8 0 4 6 8 30 Tloušťka Obr 4 Polygo četostí 4 0 Četost 8 6 4 0 0,5 3,5 6,5 9,5,5 5,5 8,5,5 4,5 7,5 30,5 Tloušťka Obr 5 Polygo četostí Všměte s, že polygoy a obrázcích 4 a 5 se sce co do tvaru globálě shodují, lokálě však kolv Lokálí kolísáí četostí lze přtom odstrat vytvořeím

7 delších třídích tervalů, tj zvýšeím počtu hodot v jedotlvých třídách Sdružíme-l apříklad tervaly ze soustavy () po čtyřech, obdržíme soustavu třídích tervalů (3) (0, 4], (4, 8], (8,], majících délku čtyř cetmetry Odpovídající polygo četostí je a obr 6 45 40 35 30 Četost 5 0 5 0 5 0 6 0 4 8 6 30 Tloušťka Obr 6 Polygo četostí Statstcké ukazatele 6 Motvačí úloha Př výrobě mcí je staovea hmotost mce pět gramů Je podezřeí, že a materálu se systematcky šetří Cílem je toto podezřeí prokázat č vyvrátt Ukážeme, jak tato úloha přímo vybízí k zavedeí ěkterých základích statstckých ukazatelů Předě s uvědomme, že eí jé cesty jak získat formac o hmotostech vyráběých mcí ež provést amátkovou kotrolu, př íž áhodě vybereme určtý (e utě přílš velký) počet mcí a určíme jejch hmotost Dejme tomu, že bylo vybráo deset mcí s ásledujícím hmotostm (v gramech): 4,9 5,0 4,88 4,79 4,89 4,7 5,0 4,97 4,86 4,93 Zázorěme získaé hodoty hmotostí jako body (malé kroužky) a číselé ose (vz obr 7) Vdíme, že soustava těchto bodů je poměrě začě posuuta doleva vůč bodu 5, odpovídajícímu staoveé ormě (Tato skutečost přtom zesluje Obr 7Data jako body a číselé ose 5

POPISNÁ 8 podezřeí, že se mce vyrábějí systematcky lehčí) Chceme-l velkost posuutí datové struktury vůč bodu 5 ějak změřt, je výhodé zastoupt polohu dat a číselé ose jedím bodem Takový bod je pak ukazatelem (mírou) polohy hromadých dat Jako velm přrozeé se jeví zastoupt polohu dat a číselé ose jejch těžštěm Lze přtom sado ukázat, že souřadcí tohoto těžště je artmetcký průměr jedotlvých dat Jou přrozeou mírou polohy je medá ebol prostředí hodota př uspořádáí dat podle velkost Jak řečeo, medá je bod, pod ímž ad ímž leží stejý počet hodot V ašem případě je počet dat sudý a medá proto eí urče jedozačě; ve skutečost je medáem lbovolé číslo ležící mez pátou a šestou hodotou, tj acházející se v tervalu ( 4,89; 4,9) Skutečost, že medá je meší ež 5, ezameá přtom c jého, ež že hodotu meší ež 5 má alespoň polova dat Artmetcký průměr je přtom rove číslu 4,898 (Na obr 7 je poloha artmetckého průměru zázorěa delší svslou čarou) Rozdíl 5 4,898 0, 0 je kvattatvím vyjádřeím posuutí datové struktury z obr 7 vůč bodu 5 doleva Skutečost, že průměrá hmotost vybraých mcí je o 0,0 g meší ež čí staoveá orma, emusí ještě utě zameat, že se mce vyrábějí systematcky lehčí Hodota rozdílu mez průměrou a staoveou hmotostí ztrácí totž a výzamu, pokud je vzorek vybraých mcí přílš malý a jestlže hmotost vyráběých mcí vykazují přílš velkou varabltu Odrazem velkost této varablty je velkost rozptýleí bodů reprezetujících hmotost vybraých mcí a číselé ose Budou-l apříklad hmotost vybraých mcí rozptýley a ose tak slě, jak to vdíme a obr 8, pak možá žádé podezřeí, že se mce vyrábějí systematcky lehčí, vůbec evzke Naopak př malém rozptýleí, které vdíme a obr 9, bude toto podezřeí patrě mohem slější ež př rozptýleí a obr 7 Ve všech třech uvažovaých případech je přtom průměrá hmotost vybraých mcí stejá Obr 8 Data s velkým rozptýleím 5 Obr 9 Data s malým rozptýleím Lze defovat růzé ukazatele (míry) rozptýleí hromadých dat; zpravdla pak kostruujeme tyto ukazatele a základě odchylek jedotlvých hodot datového souboru od ějaké cetrálí hodoty Systematckému studu rozlčých statstckých ukazatelů včetě příkladů jejch použtí je věová celý zbytek této kaptoly 5

9 Míry polohy 7 Defce Jsou-l,,, reálá čísla (reprezetující hromadá data), pak jejch artmetcký průměr je defová předpsem 8 Pozámka Výzam artmetckého průměru tkví v tom, že může ahradt jedotlvá data př výpočtu jejch součtu Přesěj řečeo, ahradíme-l všecha čísla,,, průměrou hodotou, obdržíme ový soubor čísel,,,, který má stejý součet jako soubor původí Je totž krát krát 9 Geometrcký výzam artmetckého průměru Dle 8 je To ale zameá, že ( ) 0 > ( ) ( ) < Reprezetujeme-l tedy čísla,,,, a rověž tak jejch průměr, jako body a číselé ose, je součet (absolutích hodot) odchylek bodů,,, od bodu stejý pro body ležící alevo od jako pro body ležící apravo od Shruto: Bod je těžštěm bodů,,, 0 Příklad Uvažme data 4,9 5,0 4,88 4,79 4,89 4,7 5,0 4,97 4,86 4,93 z odstavce 6 (obr 7) Jejch artmetcký průměr je rove 4,898, odchylky jedotlvých hodot od průměru jsou 0,0 0, 0,08 0,08 0,008 0,78 0, 0,07 0,038 0,03 (Ověřte s sam, že součet všech těchto odchylek je ulový, počítáme-l záporé odchylky s jejch zamékem) To ale zameá, že součet kladých odchylek je stejý jako součet záporých odchylek 0,0 0, 0, 0,07 0,03 0,08 0,08 0,008 0,78 0,038

POPISNÁ 0 Defce Nechť,,, jsou reálá čísla, přčemž (a) Je-l k lché číslo, pak medá ~ čísel,,, defujeme předpsem ~ k (b) Je-l k sudé číslo, pak medá ~ čísel,,, defujeme jako lbovolé číslo z tervalu, ], zpravdla pak jako ~ ( k ) [ k k k Jak řečeo, medá čísel,,, získáme tak, že tato čísla uspořádáme podle velkost a poté vezmeme prostředí z ch, případě průměr dvou prostředích Pozameejme v této souvslost, že latské slovo medus a aglcké meda zameá středí č prostředí Pozámky Jsou-l data rozložea a číselé ose symetrcky (vz apř obrázek 0), pak jejch artmetcký průměr (těžště) a medá ( prostředí hodota ) splývají Podstatý rozdíl mez artmetckým průměrem a medáem jakožto míram polohy hromadých dat spočívá v tom, že artmetcký průměr je v protkladu k medáu velm ctlvý a změy hodot Na druhou strau medá a ěkteré, byť velm hrubé (ebol robustí) změy v datové struktuře vůbec ereaguje (srovej obr 0 s obr ) Medá proto patří mez tzv robustí statstky 3 4 5 6 7 8 9 0 3 Obr 0 Symetrcky rozložeá data (,, 4, 6, 7 ) a číselé ose Artmetcký průměr medá jsou rovy číslu 4 3 4 5 6 7 8 9 0 3 Obr Asymetrcky rozložeá data (,, 4, 0, 3) a číselé ose Data vzkla z dat a obr 0 posuutím jejch pravé část více doprava Artmetcký průměr se rověž posouvá doprava a je rove 6, hodota medáu zůstává ezměěa (je rova 4) 3 Defce Modus je hodota, která se v hromadých datech vyskytuje s ejvětší četostí Budeme j začt ˆ Má-l mít přtom pojem modu praktcký smysl, musí být datová struktura dostatečě velká, zatímco počet hodot, které se v této struktuře vyskytují, je poměrě malý A pak ale emusí být modus urče jedozačě Pro lustrac uvažme ještě jedou data z příkladu 3 (výsledky hodů hrací kostkou) Nejfrekvetovaějším výsledkem je dvojka (padla celkem pětadvacetkrát) Modus je tedy rove dvěma V případě, že data vzkou měřeím hodot spojté áhodé velčy, lze jejch modus určt až po té, co je dostatečě hrubě zaokrouhlíme (setřídíme) Hodota modu pak závsí a způsobu setříděí Například pro data z příkladu 5 (tloušťky

stromů v porostu) a př setříděí zázorěém a obr 3 je modem hodota dvaáct (cetmetrů) To zameá, že tloušťka většy stromů se achází v rozmezí,5,5 cm Modus je mírou polohy v tom smyslu, že jde o bod, v ěmž č kolem ěhož jsou data ejvíce soustředěa Latské slovo modus je vyjádřeím pro (pravou) míru Míry rozptýleí Naším cílem dále bude vyjádřt kvattatvě míru rozptýleí (a tedy též varablty) hromadých dat Nechť,,, jsou reálá čísla (reprezetující hromadá data) Velm jedoduchou mírou rozptýleí těchto čísel (jakožto bodů a reálé ose) je rozdíl mez jejch mamálí a mmálí hodotou azývaý též rozpětí Tato míra je ovšem přílš robustí a to, aby mohla mít ějaké přílš výzamé praktcké použtí Mohem jemější míru rozptýleí čísel,,, obdržíme tak, že změříme jejch průměrou odchylku od ějaké cetrálí hodoty Položíme-l, dospějeme k ásledující defc: 4 Defce Nechť,,, jsou reálá čísla Číslo d a defovaé předpsem d a se azývá průměrá odchylka (čísel,,, od jejch artmetckého průměru) Jde o hstorcky ejstarší používaou míru rozptýleí hromadých dat avržeou fracouzským matematkem a fyzkem Perrem Laplacem (749 87) Ozačeí d je odvozeo z aglckého average devato a 5 Rozptyl a směrodatá odchylka V moderí statstce se průměrá odchylka d a používá k vyjádřeí rozptýleí dat je zřídka a ahrazuje se zpravdla průměrou kvadratckou odchylkou hodot,,, od jejch artmetckého průměru, tj výrazem (4) s ( ) Číslo s je tzv rozptyl čísel,,,, zatímco číslo s se azývá směrodatá odchylka Směrodatá odchylka je tedy odmoca z rozptylu Zdůrazěme, že slovo rozptyl jsme v této defc použl kolv v tutvím slova smyslu, ýbrž jako odborý termí ozačující kokrétím způsobem

POPISNÁ defovaou míru rozptýleí hromadých dat V tomto výzamu budeme výraz rozptyl používat v celém dalším tetu Písmeo s je v daém kotetu prvím písmeem v aglckém ekvvaletu pro směrodatou odchylku ( stadard devato ) 6 Vzorec pro výpočet rozptylu Výpočet výrazu ( ) lze zjedodušt takto: Tudíž (5) ( ) s ( ) ( ) Jak řečeo, rozptyl čísel,,, lze spočítat tak, že od průměru druhých moc čísel,,, odečteme druhou mocu jejch průměru To bývá výhodé př ručím počítáí tehdy, když čísla,,, jsou celá a kolv Obecě pak přímý výpočet rozptylu př zámé hodotě průměru vyžaduje př výpočtu dle defce (4) řádově 3 operací (tj sčítáí a ásobeí), př výpočtu podle vzorce (5) je pak počet operací rove řádově pouze 7 Příklad Uvažme ještě jedou data 4,9 5,0 4,88 4,79 4,89 4,7 5,0 4,97 4,86 4,93 z odstavce 6 (obr 7) Víme jž, že jejch artmetcký průměr je rove 4,898, odchylky jedotlvých hodot od průměru jsou 0,0 0, 0,08 0,08 0,008 0,78 0, 0,07 0,038 0,03 a součet všech těchto odchylek (uvažovaých s jejch zamékem) je ulový Symbolem d a jsme ozačl artmetcký průměr absolutích hodot těchto odchylek a symbolem s průměr jejch druhých moc Je tedy a s resp d a 0,0 0,0 0, 0,08 0,08 0,008 0,78 0, 0,07 0,038 0,03 0 0, 0,08 0,08 0, 0,07 0,038 s 4,9 5,0 4,88 4,79 0,008 0,78 0 4,89 4,7 0 5,0 4,97 4,86 4,93 0,03 4,898,,

3 použjeme-l k výpočtu rozptylu vzorce (5) Vyjde 0,07, s 0,0079, s 0, 09 Pro data z obr 8 máme d a 0,8, s 0, 36, pro data z obr 9 pak dostaeme d a 0,05, s 0, 07 d a 8 Vztah mez směrodatou a průměrou odchylkou Čísla s a d a mají stejý fyzkálí rozměr a podávají o souboru dat,,, stejý typ formace (měří určtým způsobem rozptýleí čísel,,, a číselé ose) Hodoty odchylek s a d a se ovšem lší, přčemž vždy platí, že (6) d a s Přrozeě defovaou průměrou odchylku d a ahrazujeme v matematckostatstcké teor směrodatou odchylkou s proto, že teore založeá a počítáí s odchylkam kvadratckým amísto odchylek absolutích je mohem jedodušší a elegatější Dokažme erovost (6) Položme y Ze vzorce (5) plye, že rozdíl je ezáporý, a tedy y y y To je ale dokazovaá erovost (6) Uvažujme ještě o tom, pro jaká data se odchylky s a d a shodují Pokud tato stuace astae, pak též s, čl d a y y Odtud dle vzorce (5) vyplývá, že rozptyl čísel y, y,, y je ulový, z čehož dále plye, že y y y, a tedy To však astae právě tehdy, když buď (a) ebo (b) je sudé a čísla,,, abývají právě dvou hodot; přtom každá z obou hodot se vyskytuje ve stejém počtu Naopak, v obou případech (a) (b) je s d a Dospíváme k závěru, že průměrá odchylka d a a směrodatá odchylka s abývají stejé hodoty tehdy a je tehdy, astae-l ěkterý z výše popsaých případů (a) ebo (b) y

POPISNÁ 4 9 Pozámka Všechy výše zavedeé míry rozptýleí čísel,,, a číselé ose, totž rozpětí, průměrá odchylka, směrodatá odchylka a rozptyl mají ásledující společé vlastost: (a) jsou vždy ezáporé, přčemž mohou abýt lbovolé ezáporé hodoty, (b) jsou ulové, pokud, (c) jsou eulové (a tedy kladé), pokud všecha čísla,,, ejsou totožá 0 Ilustrace Na ásledujících třech obrázcích jsou schematcky zázorěy výšky tří stejě početých skup stromů Přestože výšky mají ve všech třech souborech totéž rozpětí, tutvě vzato je rozptýleí výšek stromů a obr meší ež a obr 3 a u stromů a obr 3 je zase meší ež u stromů a obr 4 Teto poct je přtom velm dobře kvatfková hodotou jak směrodaté, tak průměré odchylky Obr Rozptýleí výšek stromů ( 3, rozpětí je 4, d 5 0, 3, s 0, 5 ) a Obr 3 Rozptýleí výšek stromů ( 3, rozpětí je 4, d, 0, s, 4 ) a Obr 4 Rozptýleí výšek stromů ( 3, rozpětí je 4, d a s )

5 Varačí koefcet Př porováváí varablty ěkolka datových souborů je ěkdy žádoucí vyjádřt míru rozptýleí hromadých dat relatvě vzhledem k jejch průměré hodotě Například rozpětí, průměrá odchylka směrodatá odchylka výšek stromů zázorěých a obrázcích 5 a 6 jsou stejé Relatvě však výšky stromů a obr 5 vykazují mohem meší rozptýleí ež výšky stromů a obr 6 Statstckým ukazatelem, který teto rozdíl v rozptýleí hromadých dat dobře vysthe, je kupříkladu poměr s, azývaý varačí koefcet Hodota tohoto koefcetu se přtom často vyjadřuje v procetech Obr 5 Varablta výšek stromů ( 9, rozpětí je, d a s, s 9, % ) Obr 6 Varablta výšek stromů ( 3, rozpětí je, d a s, s 3 33,3% ) Příklady Určíme míry polohy a rozptýleí pro výsledky hodů hrací kostkou z příkladu 3 Uspořádáme-l data podle velkost (vzestupě), dostaeme ásledující posloupost: 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 Jde o řadu sto dvacet čísel, prostředím hodotam jsou tedy šedesátá a šedesátá prví Ty jsou obě rovy třem, a tedy medá je rove třem To zameá, že malé hodoty, a 3 převládají ad velkým hodotam 4, 5 a 6 Přtom modus (ejčastěj se vyskytující hodota) je rove dvěma Uvědomte s, že tyto skutečost lze velm rychle zjstt též ahlédutím do tabulky č Počítáme-l artmetcký průměr ze setříděých dat v tabulce, je potřeba zahrout všechy hodoty tolkrát, kolk čí četost jejch výskytu v datech Dostaeme 7 5 4 3 9 4 7 5 8 6 3,4 0 Je důležté s povšmout, že výpočet lze provést též a základě zalost relatvích četostí z tabulky, až bychom zal počet měřeí Lze totž psát

POPISNÁ 6 7 5 4 3 9 4 7 5 8 6 0 7 0 5 0 4 0 3 9 0 4 7 0 5 8 0 6 0,4 0,08 0,00 3 0,58 4 0,4 5 0,50 6 Četost resp relatví četost hrají tedy př výpočtu artmetckého průměru rol vah jedotlvých hodot Podobě pro průměrou odchylku dostaeme s d a 7 3,4 5 3,4 4 3 3,4 9 4 3,4 7 5 3,4 8 6 3,4,4 0 Pro rozptyl pak máme 7 ( 3,4) 7 5 5 ( 3,4) 4 3 9 4 0 4 (3 3,4) 9 (4 3,4) 0 7 5 8 6 3,4 Koečě pro směrodatou odchylku obdržíme s, 64 (Přtom stejě jako výpočet měr polohy lze výpočet odchylek zalost relatvích četostí) Shruto: ~ 3,4; ˆ ; 3; d a,4; s,69; s, 64 3 Lze ukázat, že pro tloušťky stromů v porostu z příkladu 5 je: 7 (5 3,4),69 ~ 38,5; 34; d a 7,6; s 03,5; s 34,69 8 (6 3,4) d a a s provést pouze a základě Vyjádříme-l přtom aměřeé hodoty tlouštěk v cetmetrech (bez zaokrouhleí), dostaeme: ~ 3,85; 3,4; d a,76; s,03; s 3,47 Zmeší-l se totž všecha data desetkrát, zmeší se desetkrát všechy charakterstky s výjmkou rozptylu, který se v takovém případě zmeší stokrát (Zdůvoděte to!) 4 Sheppardova korekce a terpolace medáu Kumulatví četost V pra se občas stává, že ejsou k dspozc orgálí data, ýbrž pouze data setříděá, přtom však velčy, jejchž změřeím byla data získáa, jsou spojté (To vede samozřejmě k jsté ztrátě formace) Výpočet statstckých ukazatelů a základě takových setříděých dat pak provádíme tak, že původí aměřeé hodoty ahradíme středy odpovídajících tříd Ilustrujme teto postup a datech z příkladu 5 (tloušťky stromů v porostu) setříděých po čtyřech cetmetrech (vz obr 6) Tabulka četostí odpovídající daému setříděí je ásledující: Tloušťka (cm) 4 8 8 6 6 0 0 4 4 8 Četost 3 4 8 6 Použjeme-l data z této tabulky k výpočtu medáu, artmetckého průměru, rozptylu a směrodaté

7 odchylky tlouštěk, dostaeme ~ 4, 6 3 0 4 4 8 8 6 6 00 3,88, s 6 3 0 4 4 8 8 00 6 6 3,88 4,5456, s 3,8 Výsledky se přrozeě lší od těch které byly vypočítáy z původích esetříděých dat (vz 3) Lze přtom ukázat, že chyba, ke které došlo př výpočtu artmetckého průměru, je zcela áhodé povahy Př výpočtu rozptylu dochází ovšem k jeho systematckému adhodoceí Velkost tohoto adhodoceí je v případě stejě šrokých tříd rova řádově h, kde h je šířka třídy Oprava spočívající v odečteí čísla h od rozptylu vypočteého ze setříděých dat, se azývá Sheppardova korekce V ašem případě je opraveá hodota rozptylu rova 4,5456 6 3, Odpovídající hodota směrodaté odchylky je pak as 3, 63 TAB 4 Tabulka kumulatvích četostí Tloušťka (cm) 8 6 0 4 8 Kumulatví četost 34 75 93 99 00 Relatví kumulatví četost 0,0 0,34 0,75 0,93 0,99,00 0,9 Relatví kumulatví četost 0,8 0,7 0,6 0,5 0,4 0,3 0, 0, 0 0 4 8 ~ 6 0 4 8 3 Tloušťka Obr 7 Polygo relatvích kumulatvích četostí a grafcká terpolace medáu

POPISNÁ 8 Co se týče medáu, sado ahlédeme, že se achází v třídě 6 cm Tuto hodotu lze dále zpřest pomocí leárí terpolace, př íž předpokládáme, že uvtř jedotlvých tříd jsou hodoty dat rozložey zhruba rovoměrě Př realzac terpolace je výhodé ahradt četost tzv kumulatvím četostm č ještě lépe relatvím kumulatvím četostm (vz tabulka 4 a obr 7) Užtím tabulky relatvích kumulatvích četostí obdržíme pro leárí terpolac medáu ásledující vztahy: ~ 50 34 0,50 0,34 6 75 34 0,75 0,34 Odtud pak ~ 50 34 0,50 0,34 4 4,56 3,56 4 0,4 Na obr 7 je terpolace medáu zázorěa grafcky Povšměte s, že úsečky polygou kumulatvích četostí leží ad jedotlvým třídam; strmost těchto úseček je přtom úměrá třídím četostem Třída, ad kterou leží ejstrmější úsečka lokalzuje tedy modus Koefcet dsperze 5 Defce a vlastost Koefcet dsperze je defová jako poměr rozptylu a artmetckého průměru a bývá používá v dscplíě azývaé prostorová statstka jako míra agregovaost č regularty prostorových bodových struktur Vysvětlíme ejprve příslušé pojmy Prostorem rozumíme lbovolý Eukledovský prostor ebo jeho část; může jít tedy o prostor třírozměrý, ale též dvojrozměrý (rovu) ebo jedorozměrý (přímku) Prostorová bodová struktura (stručěj bodová struktura) je defováa jako áhodé rozmístěí bodů v prostoru Body přtom obvykle reprezetují pozce určtých hmotých objektů (jedců) č místa výskytu jstých áhodých událostí Jako příklad bodové struktury lze uvést rozmístěí hvězd v gala, bakterí č molekul ějaké látky v ovzduší, květ a louce, stromů v lese č podél potoka, ldí v parku ebo vlaštovek a drátě Typckým příkladem jedorozměré bodové struktury je posloupost okamžků výskytu ějakých áhodých událostí; prostorem je v takovém případě časová osa Zkoumaým událostm mohou být třebas ehody a dálc, poruchy jstého stroje, pracoví úrazy, příchody hovorů a telefoí ústředu apod Ve všech výše uvedeých příkladech se může jedec č událost vyskytout v lbovolém místě prostoru Někdy je však teto výskyt omeze pouze a určtá odděleá místa v prostoru S takovou stuací se setkáme apříklad př studu rozmístěí houseek č brouků a rostlách, roztočů a lstech apod Na obrázcích 8 a 9 je zázorěo rozmístěí stromů a čtvercovém staovšt; a každém z těchto obrázků vdíme tedy dvojrozměrou bodovou strukturu Povaha obou struktur je ovšem začě odlšá Zatímco sekvoje a prvím obrázku vytvářejí dobře patré shluky, rozmístěí smrků a druhém obrázku je víceméě pravdelé, tj s řádově srovatelým rozestupy mez jedcv prvém případě mluvíme o agregovaé (ahloučeé), kdežto v druhém o regulárí (pravdelé) struktu-

9 ře Bodová struktura se ám ovšem emusí jevt a jako agregovaá, a jako regulárí; jako příklad může sloužt struktura a obr 0 Pozameejme přtom, že výskyt takových struktur je v přírodě poměrě vzácý Obr 8 Prostorové rozmístěí sekvojí Obr 9 Prostorové rozmístěí smrků (koefcet dsperze je rove,9) (koefcet dsperze je rove 0,5) Obr 0 Výsledek zcela áhodého rozmístěí bodů ve čtverc (koefcet dsperze je rove,) Pokryjme yí každé ze staovšť a obrázcích 8 0 pravdelou čtvercovou sítí (dejme tomu o rozměrech 0 0 čtverců) a spočítejme artmetcký průměr, rozptyl a koefcet dsperze počtu jedců v jedotlvých čtvercích (vz tabulky 5 7) Všměte s, že v případě agregovaé struktury a obr 8 je a rozdíl od struktur a obrázcích 9 a 0 relatvě velké možství čtverců prázdých, zatímco poměrě málo jch obsahuje právě jedoho jedce Tato skutečost má zřejmě za ásledek poměrě vysokou hodotu rozptylu počtu jedců ve čtvercích, a tedy též vysokou hodotu koefcetu dsperze Naopak ze všech tří struktur vykazuje ejmeší hodotu rozptylu počtu jedců ve čtvercích, a rověž tak ejmeší hodotu koefcetu dsperze regulárí struktura a obr 9

POPISNÁ 0 TAB 5 Prostorové rozmístěí sekvojí Počet jedců ve čtverc 0 3 4 5 Počet čtverců s daým počtem jedců 68 4 9 7 0,6, s,6, s,9 TAB 6 Prostorové rozmístěí smrků Počet jedců ve čtverc 0 3 4 5 Počet čtverců s daým počtem jedců 8 54 8 0 0 0 0,9, s 0,45, s 0,5 TAB 7 Výsledek zcela áhodého rozmístěí bodů ve čtverc Počet bodů ve čtverc 0 3 4 5 Počet čtverců s daým počtem bodů 35 43 3 6, s,06, s, Obecě lze ukázat, že př vhodé volbě velkost čtverců je hodota koefcetu dsperze ve strukturách, které se jeví jako agregovaé, výrazě větší ež jeda; čím více se přtom struktura zdá být agregovaá, tím větší je hodota koefcetu dsperze Naopak v regulárích strukturách je koefcet dsperze výrazě meší ež jeda; čím více je přtom struktura regulárí, tím je hodota koefcetu dsperze meší Koečě ve strukturách, které se ejeví a agregovaé, a regulárí se koefcet dsperze eodlšuje přílš od jedčky 6 Příklad (rozmístěí roztočů a jabloňových lstech) Vyšetřujme prostorové rozmístěí roztočů a lstech jabloě a základě dat z příkladu 4 Prostorovým jedotkam, v chž zazameáváme počet vyskytujících se jedců (roztočů), echť jsou jedotlvé jabloňové lsty Mají-l přtom uvedeá data poskytout smysluplou formac o prostorovém rozmístěí roztočů, je třeba předpokládat, že všechy lsty jsou (alespoň přblžě) stejě velké Artmetcký průměr a rozptyl počtu roztočů a lstech je, 5 a s, 6 ; koefcet dsperze s, 0 Jde proto o začě agregovaou strukturu Průměry Př řešeí řady praktckých úloh je třeba vypočítat průměrou hodotu čísel,,,, přčemž výsledkem emusí být průměr artmetcký Podáme dále defce ěkterých často se vyskytujících typů průměrů a příklady jejch použtí

7 Kvadratcký průměr Nechť,,, jsou kladá čísla Kvadratcký průměr K těchto čísel defujeme předpsem Je tedy K K K K K, krát což zameá, že kvadratckým průměrem můžeme ahradt jedotlvé hodoty,,, př výpočtu součtu jejch druhých moc s je jejch rozptyl Vzo- 8 Pozámka Nechť,,, jsou kladá čísla a rec (5) lze pak přepsat ve tvaru Je tedy Odtud plye ásledující tvrzeí: s K K s 9 Tvrzeí Nechť,,, jsou kladá čísla Pak K, přtom rovost astává právě tehdy, když Uvědomte s též, že průměrá odchylka d a je artmetckým průměrem z odchylek čísel,,, od jejch artmetckého průměru, zatímco směrodatá odchylka s je kvadratckým průměrem těchto odchylek Nerovost (6) mez průměrou odchylkou a odchylkou směrodatou lze tedy považovat za specálí případ tvrzeí 9 30 Příklad (dedrometrcký) V dedrometr se s pojmem kvadratckého průměru setkáváme př výpočtu průměré (kruhové) výčetí základy Představme s porost čítající stromů s výčetím tloušťkam d, d,, d (Výčetí tloušťkou stromu rozumíme tloušťku změřeou v tzv prsí výšce, tj ve výšce,3 metru ad zemí) Pro každý strom uvažme řez kmee rovou vedeou v prsí výšce kolmo ke kme Předpokládejme, že teto řez má pro všechy stromy kruhový tvar Řez - tým stromem je tedy kruh s průměrem d a obsahem 4 πd Teto kruh se azývá kruhová výčetí základa č stručěj výčetí základa (aglcky basal area ) Obsah celkové výčetí základy, tj hodota součtu

POPISNÁ 4 πd je velčou, jejíž zalost je důležtá př odhadu objemu dřeva v porostu Př výpočtu obsahu celkové výčetí základy můžeme ovšem výčetí základy jedotlvých stromů zastoupt průměrou kruhovou výčetí základou, tj kruhem o obsahu 4 πd Výčetí tloušťku stromu s průměrou kruhovou výčetí základou ozačme d Zřejmě je ebol 4 πd 4 (7) 4 πd π d 4 πd Rovost (7) lze terpretovat tak, že obsah celkové výčetí základy stromů s výčetím tloušťkam d, d,, d je stejý jako obsah celkové výčetí základy stejě tlustých stromů s výčetí tloušťkou d Tloušťka d eí ovšem artmetckým průměrem tlouštěk d, d,, d Z rovost (7) totž postupě dostaeme d d d, d d d K, d Jak řečeo, výčetí tloušťka stromu s průměrou kruhovou výčetí základou je kvadratckým průměrem výčetích tlouštěk jedotlvých stromů v porostu Ozačíme-l tedy po řadě d a s d artmetcký průměr a rozptyl čísel d, d,, d, pak a proto vždy d d s d d d, Pro kokrétí lustrac uvažme staovště s devít stromy, jejchž prostorové rozmístěí včetě výčetích kruhových základe je zázorěo a obr Numercké hodoty výčetích tlouštěk jedotlvých stromů (v cetmetrech) echť jsou přtom ásledující: 0 0 30 30 40 40 50 50 60 Na obr jsou pak zázorěy výčetí kruhové základy stejě tlustých stromů zaujímajících a daém staovšt tutéž polohu jako stromy a obr Obsah celkové výčetí základy je přtom a obou obrázcích stejý Jak řečeo, výčetí základy stromů a obr jsou artmetckým průměrem výčetích základe stromů a obr Tloušťka stromů a obr je tedy kvadratckým průměrem tlouštěk stromů a obr Hodota této tloušťky je,

3 cetmetrů 0 0 30 30 40 9 40 50 50 60 40 Obr Obr 3 Geometrcký průměr Nechť,,, jsou kladá čísla Geometrcký průměr G těchto čísel defujeme předpsem Je tedy (8) G G G G G, krát což zameá, že geometrckým průměrem můžeme ahradt jedotlvé hodoty,,, př výpočtu jejch souču Z rovost (8) plye, že l l l l G l G l G, krát čl l l l (9) l G To zameá, že logartmus geometrckého průměru čísel,,, je rove artmetckému průměru logartmů těchto čísel Rovost (9) bývá používáa př umerckém výpočtu geometrckého průměru a platí zřejmě pro logartmus o lbovolém základu 3 Úloha (bakoví) Určete celkovou aspořeou částku z vkladu 60 000 Kč po pět letech, jestlže vklad měl ročí úročeí a úroková míra čla v prvím roce 4%, ve druhém 8%, ve třetím 6% a ve čtvrtém a pátém roce % Určete též průměrou úrokovou míru během celého pětletého období Řešeí Naspořeá částka a koc pětletého období čla 60000,04,08,06,, 89608,7 Kč

POPISNÁ 4 p Ozačme p průměrou úrokovou míru (v %) a položme r Výzam čísla p je takový, že 00 v případě pevé ročí úrokové míry p % by celková aspořeá částka a koc pětletého období byla stejá jako př výše popsaé pohyblvé úrokové míře Je tedy To ale zameá, že čl 60000 r r r r r 60000,04,08,06,, r r r r r,04,08,06,,, 5 r,04,08,06,, Číslo r je tedy geometrckým průměrem čísel,04;,08;,06;,;, Vyjde r,0835 Průměrá úroková míra čla tedy as 8,35% Artmetcký průměr procetuálích úrokových měr, tj čísel 4, 8, 6,,, je přtom 8,4, tedy větší ež je správě vypočteých 8,35 Pozameejme, že podobým způsobem by se počítala též průměrá fertlta, mortalta č růstová tezta v daé populac 33 Příklad (dedrometrcký) V příkladu 30 byl zavede pojem kruhové výčetí základy stromu (kmee) Chceme-l být více realstčtí, můžeme předpokládat, že tato základa eí kruhová, ýbrž že má tvar elpsy Dejme tomu, že umíme odhadout osy této elpsy, tj dva avzájem kolmé směry, ve kterých má kme ejmeší a ejvětší výčetí tloušťku Změřme tyto tloušťky a ozačme jejch velkost d a d Obsah elpsy s průměry d a d je jak zámo rove 4 dd π Trváme-l ovšem a tom, že obsah výčetí základy chceme počítat jako obsah kruhu, je třeba jeho průměr d zvolt tak, aby teto kruh a elpsa s průměry d a d měly stejý obsah To vede k rovc z íž dále plye, že 4 d 4 πd d π, d d d a d dd Číslo d je tedy geometrckým průměrem čísel d a d Závěr: Provádíme-l měřeí tlouštěk stromů ve dvou avzájem kolmých směrech, tato měřeí jsou prováděa za účelem výpočtu obsahu výčetí základy a obě aměřeé tloušťky ahrazujeme z úsporých důvodů jedou (průměrou) hodotou, je třeba použít průměr geometrcký (a kol artmetcký!) 34 Harmocký průměr Nechť,,, jsou kladá čísla Harmocký průměr H těchto čísel defujeme předpsem

5 H Je tedy H, H H H krát což zameá, že harmockým průměrem můžeme ahradt jedotlvé hodoty,,, př výpočtu součtu jejch převráceých hodot Pozameejme ještě, že lze psát H a že harmocký průměr dvou kladých čísel, y je y y y y 35 Úloha (dopraví) Předpokládejme, že automobl jede ejprve do kopce rychlostí čtyřcet km/hod a poté stejou trasou zpátky rychlostí osmdesát km/hod Jaká je průměrá rychlost automoblu během této projížďky? Řešeí Průměrou rychlostí rozumíme takovou rychlost v (km/hod), že jízda, př íž bychom celou trasu projel tam zpět touto rychlostí, by trvala stejě dlouho jako jízda čtyřcetklometrovou rychlostí do kopce ásledovaá jízdou osmdesátklometrovou rychlostí z kopce Nechť s je délka trasy (v jedom směru) v klometrech Porováím časů př rovoměrém a erovoměrém způsobu jízdy obdržíme rovc s s s s v v 40 80 Odtud vyplývá, že a, v v 40 80 v v 40 80 40 80

POPISNÁ 6 Rychlost v je tudíž harmockým průměrem čísel 40 a 80 Vyjde 40 80 v 53,3 km/hod 40 80 Vypočítaá průměrá rychlost je meší ež artmetcký průměr čísel 40 a 80, což je v souladu se skutečostí, že meší rychlostí (do kopce) se jelo déle 36 Pozámka Nechť,,, jsou kladá čísla, přčemž () je ejmeší a () ejvětší z ch Lze ukázat, že platí ásledující erovost: (0) ( ) H G K ( ) Jestlže je přtom, pak všechy erovost v (0) přecházejí v rovost Naopak ejsou-l všecha čísla,,, stejá, pak jsou všechy erovost v (0) ostré 37 Průměr stupě Všechy výše defovaé typy průměrů lze považovat za specálí případy tzv průměru stupě Kokrétě echť 0 je daé reálé číslo a,,, jsou kladá čísla (reprezetující hromadá data) Průměr stupě z čísel,,, defujeme předpsem () Okamžtě vdíme, že artmetcký průměr je průměrem stupě jeda, kvadratcký průměr je průměrem stupě dva a harmocký průměr je průměrem stupě Ze vztahu () plye, že Posledí vztah lze psát jako a, krát což zameá, že průměrem stupě můžeme ahradt jedotlvé hodoty,,, př výpočtu součtu jejch - tých moc 38 Příklad Uvažme soubor borůvek sesbíraých a daé lokaltě Předpokládejme, že borůvky mají kulový tvar a že záme poloměry r, r,, r jedotlvých borůvek Chceme určt poloměr borůvky s průměrým objemem Ozačme teto poloměr r Zřejmě platí:

7 Odtud pak plye, že 4 3 4 3 πr 3 π 3 r čl r 3 3 r 3 r 3, resp r 3 3 3 r 3 r r Jak řečeo, poloměr r průměrě objemé borůvky je rove průměru třetího stupě z poloměrů r, r,, r jedotlvých borůvek Teto průměr zastupuje čísla r, r,, r př sčítáí jejch třetích moc Defc průměru stupě elze bezprostředě použít pro případ 0 Pak totž a pravé straě rovost () stojí eurčtý výraz typu Je ovšem přrozeé defovat průměr stupě ula jako lmtí hodotu výrazu () pro 0, tj předpsem 0 lm 0, Ukážeme yí, že pro lbovolý soubor kladých čísel estuje a určíme její hodotu,,, tato lmta 39 Tvrzeí (o průměru stupě ula) Nechť,,, jsou pevě daá kladá čísla Pak lm 0 (Za průměr stupě ula je tedy přrozeé považovat průměr geometrcký) Důkaz Dle defce obecé mocy je Užtím ľ Hosptalova pravdla dostaeme ( )l e l lm 0 l lm 0 l l

POPISNÁ 8 Tudíž dle věty o lmtě složeé fukce lm e 0 l, což bylo dokázat 40 Průměry stupě ± Nechť,,, jsou kladá čísla, přčemž () je ejmeší a () ejvětší z ch Pro lbovolé reálé číslo zřejmě platí, že () ( ) ( ) Vhodou volbou čísla se lze přtom k mezím () a () lbovolě přblížt Platí totž: (3) lm ( ) a lm ( ) Je tedy přrozeé považovat číslo () za průměr stupě a číslo () za průměr stupě Nerovost (0) a () jsou specálím případem věty (vz 4), která říká, že pro pevě daý soubor čísel,,, roste hodota průměru s rostoucí hodotou stupě Měí-l se přtom stupeň spojtě, měí se hodota průměru spojtě; průměr abude tedy pro vhodou hodotu stupě lbovolé hodoty z tervalu, ] [ ( ) ( ) Dodatky 4 Věta (o erovostech mez průměry) Nechť,,, je pevě daý soubor kladých reálých čísel, přčemž tato čísla ejsou všecha stejá Ozačme průměr stupě z čísel,,, ; přtom klademe 0, ( ) a ( ), kde () je mmum a () mamum čísel,,, Tímto způsobem je a rozšířeé reálé ose [, ] defováa reálá fukce s hodotam v tervalu, ] Tato fukce je spojtá a rostoucí [ ( ) ( ) Důkaz * Jelkož obecá moca je spojtá fukce a součet složeí spojtých fuk-

9 cí je spojtá fukce, je přřazeí v tervalu (, 0), a rověž tak v tervalu ( 0, ), spojtou fukcí Jelkož však v bodech 0,, je průměr dodefová lmtou, je toto přřazeí spojtou fukcí v celé rozšířeé reálé ose Ukážeme yí, že přřazeí je fukcí rostoucí, tj že platí: < < (I) Nejprve ukážeme, že pro > je > Budeme přtom dokazovat zesíleí tohoto tvrzeí pro průměry vážeé Nechť tedy,,, jsou kladá čísla (váhy) taková, že Chceme ukázat, že (4) > (Volbou odtud obdržíme erovost > ) Vzhledem k tomu, že číslo je kladé, je erovost (4) ekvvaletí s erovostí (5) > Důkaz erovost (5) provedeme dukcí dle (a) Nechť Máme ukázat, že pro lbovolá dvě kladá čísla γ, δ taková, že γ δ a pro lbovolá dvě vzájemě růzá kladá čísla, je δ > ( γ δ γ ) Za tím účelem zkoumejme fukc f ( ) v proměé, kde ( 0, ) Jelkož >, je tato fukce v celém svém defčím oboru koveí, a tedy pro lbovolá dvě růzá kladá čísla, leží všechy vtří body úsečky s krajím body, f ( )] a, f ( )] ad grafem fukce f () To ale zameá, že [ [ γ f ( ) δf ( ) > f ( γ δ ), což bylo dokázat (b) Předpokládejme yí, že pro ějaké přrozeé číslo je jž erovost (5) dokázáa Nechť,,, jsou kladá čísla, přčemž alespoň dvě z ch jsou vzájemě růzá Dále echť,,, jsou kladá čísla taková, že Lze psát

POPISNÁ 30, ) ( přtom dle dukčího předpokladu Vezmeme-l tedy v úvahu fakt, že pro je jž erovost (5) dokázáa, dostaeme, ) ( ) ( ) ( přtom alespoň jeda z předchozích erovostí musí být ostrá (rozmyslete s proč) Tím je provede dukčí krok, a tedy důkaz erovost (5) (II) Ukážeme, že <, pokud < < < 0 To je ale téměř bezprostředí důsledek erovostí mez průměry dokázaých v část (I) Je totž >, a tedy dle (I) [ ] [ ] > Odtud pak >, což bylo dokázat Přechodem k lmtám pro 0 a dále dostaeme, že < pro < 0 (III) Ukážeme, že <, pokud 0 < < < To ale hed vyplye z erovostí mez průměry dokázaých v část (II) Je totž < < < 0, a tedy dle (II)

3 [ ] [ ] < [ ] [ ] Přechodem k převráceým hodotám dostaeme, že < Přechodem k lmtám pro 0 a dále dostaeme, že < pro < 0 (IV) Spojeím erovostí dokázaých v (II) a (III) obdržíme dokazovaou větu V prcpu by bylo možé defovat průměrou odchylku směrodatou odchylku od jé cetrálí hodoty ež od artmetckého průměru V jstém smyslu ejlepší volba této cetrálí hodoty je taková, pro ž příslušá odchylka abývá mmálí hodoty Vzká otázka, zda artmetcký průměr má tuto vlastost Odpověď dávají ásledující dvě tvrzeí 4 Tvrzeí Nechť,,, je pevě daý soubor čísel Pak fukce f ( ) abývá v bodě svého mma Důkaz Sado ahlédeme, že ( ) f ( ), což zameá, že f () je kvadratcká fukce a jejím grafem je parabola Vrchol V této paraboly určíme doplěím a úplý čtverec Kokrétě f ( ) s ( ) ( ) kde s je rozptyl čísel,,, Je tedy V (, s ), což bylo dokázat (Přrozeě bylo též možo vypočítat dervac fukce f () a ptát se, kdy je tato dervace ulová) 43 Tvrzeí Nechť,,, je pevě daý soubor čísel Pak fukce, f ( )

POPISNÁ 3 abývá v bodě ~ svého mma Důkaz Přeecháváme jej čteář jako cvčeí Vdíme tedy, že je správé, když směrodatá odchylka se defuje jako odchylka od artmetckého průměru, a druhou strau průměrá odchylka by měla být defováa spíše jako odchylka od medáu 44 Tvrzeí Nechť R je rozpětí a s směrodatá odchylka souboru čísel,,, Pak s R Důkaz Ozačme () ejmeší a () ejvětší z čísel,,, a položme ( ( ) ( ) ) Bod je středem úsečky [ ( ), ( ) ], a proto R pro lbovolé z čísel Použjeme-l avíc tvrzeí 4, dostaeme, že ( R ) ( ) 4 Odtud jž bezprostředě plye dokazovaá erovost 45 Samuelsoova erovost Nechť s je směrodatá odchylka souboru čísel,,, Pak Důkaz Vz [ ] Vzhledem k tomu, že je zřejmě ma s R ma, obdržíme spojeím tvrzeí 44 a Samuelsoovy erovost ásledující vztahy mez směrodatou odchylkou a rozpětím: (6) s R s, resp R s R Cvčeí Př kotrole jakost bylo áhodě vybráo devět výrobků; jejch hmotost (v gramech) jsou přtom ásledující: 43,0 5, 49,7 48, 53,8 49,8 53,0 47,0 49, Určete artmetcký průměr, rozptyl, směrodatou odchylku a průměrou odchylku zazameaých hmotostí Výsledek: 49, 4; s 9, 37 ; s 3, 06 ;, 3 d a

33 Ve dvaáctčleé studjí skupě bylo př zápočtovém testu dosažeo ásledujících bodových výsledků (mamálí možý počet bodů je rove deset): 3 5 7 0 0 0 0 8 0 0 8 3 Vypočítejte modus, medá a artmetcký průměr zazameaých výsledků Výsledek: ˆ 0, ~ 8, 7 3 Uveďte příklad pět vzájemě růzých kladých čísel vyhovujících současě ásledujícím dvěma podmíkám: () artmetcký průměr čísel je meší ež jejch medá, () součet všech čísel je rove jedé 4 * Dokažte tvrzeí 43 5 Určete medá a artmetcký průměr všech lchých přrozeých čísel meších ež jede tsíc 6 Datový soubor sestává z deset čísel, přčemž platí: () součet všech čísel v souboru je rove dvacet, () součet jejch druhých moc je dvě stě Vypočítejte směrodatou odchylku Výsledek: s 4 7 Jak se změí modus, medá, artmetcký průměr, rozpětí, průměrá odchylka, rozptyl, směrodatá odchylka a varačí koefcet souboru čísel,,,, jestlže: a) všecha tato čísla vyásobíme dvěma, b) u všech čísel změíme zaméko, c) všecha čísla zvětšíme o deset jedotek? 8 Jak se změí průměr stupě souboru kladých čísel,,,, jestlže všecha tato čísla vyásobíme kladou kostatou c? 9 Vypočítejte artmetcký, harmocký a geometrcký průměr, průměr druhého stupě a rozptyl ásledujícího souboru čísel:,,,,,,,, 3, 3,, 3 30 krát 60 krát 90 krát Proveďte zkoušku správost seřazeím vypočteých průměrů podle velkost Zdůvoděte, proč zcela stejý výsledek obdržíme pro soubor čísel,,, 3, 3, 3 Výsledek:, 3 ; g, 8 ; h ;, 45 ; s 5 9

POPISNÁ 34 0 Dokažte elemetárím způsobem, že artmetcký průměr dvou kladých čísel, y je vždy alespoň tak velký jako jejch průměr geometrcký Přechodem k převráceým hodotám odtud odvoďte erovost mez průměrem geometrckým a harmockým a) V rově jsou arýsováy čtverec a obdélík o stejém obvodu Dokažte, že obsah čtverce je větší ež obsah obdélíka b * ) V rově jsou arýsováy kružce a elpsa stejé délky Dokažte, že plocha ohračeá kružcí má větší obsah ež plocha ohračeá elpsou c * ) Dokažte, že ze všech trojúhelíků o stejém obvodu má ejvětší obsah trojúhelík rovostraý d * ) Dokažte, že ze všech kvádrů o stejém objemu má ejmeší povrch krychle Návod: Použjte větu o erovostech mez průměry * Na prví pohled by se mohlo zdát, že výrazě ctlvější míru rozptýleí čísel,,, a reálé ose ež jakou je jejch rozptyl obdržíme tak, že spočítáme průměrou hodotu druhých moc vzdáleostí ) všech dvojc čísel { } j ( j, ze souboru,,, Ve skutečost je však v takovéto charakterstce obsažea stejá formace jako v ám defovaém rozptylu Platí totž, že Dokažte to j ( ) ( ) j 3 Prostorové rozmístěí stromů v porostu Šesthektarový borový porost byl rozděle a šest set stejě velkých, vzájemě se epřekrývajících částí ( čtverců ) Počty stromů v jedotlvých čtvercích jsou zazameáy v ásledující tabulce: Počet stromů ve čtverc 0 3 4 5 6 Počet čtverců s daým počtem stromů 4 30 08 5 60 8 a) Zázorěte rozděleí počtu stromů ve čtvercích tyčkovým dagramem b) Vypočítejte koefcet dsperze a terpretujte získaý výsledek Výsledek:, 4 ; s, 7 ; s 0, 6 ; stromy jsou a daém staovšt rozmístěy velm pravdelě

35 4 Prostorové rozmístěí velkých stíek (Phlosca muscorum) 0 5 3 0 0 0 0 0 0 3 4 0 0 3 5 0 0 3 0 4 0 0 0 Na obrázku je zazameá výsledek aalýzy prostorového rozmístěí stíek ve spadaém lstí a humusu v část bukového háje poblíž Ofordu Studovaá plocha byla pokryta pravdelou šestúhelíkovou sítí s šířkou šestúhelíku jeda stopa (0,30 m) a poté byl spočítá počet stíek přpadajících a jede šestúhelík (Data jsou převzata z čláku Mea crodg od M Lloyda otštěého v roce 967 v časopsu Joural of Amal Ecology) Vypočítejte koefcet dsperze a terpretujte získaý výsledek Výsledek: 53 37, 43 ; s, 5 ; s, 6 ; prostorová struktura je poměrě začě agregovaá 5 Pracoví úrazy V ásledující tabulce je zazameá počet pracovích úrazů v určtém úseku hlubého dolu přpadajících a jedu směu: Počet úrazů během směy 0 3 4 5 6 Počet smě s daým počtem úrazů 6 40 7 Prezetujte získaá data pomocí tyčkového dagramu Dále vypočítejte koefcet dsperze počtu úrazů přpadajících a jedu směu a terpretujte získaý výsledek Výsledek: 0, 44 ; s 0, 8; s, 8 ; vysoká hodota koefcetu dsperze prozrazuje, že úrazy ejsou patrě zcela áhodým událostm 6 Počet blzových laloků makovce Počet laloků 6 7 8 9 0 3 4 5 6 7 8 9 0 Počet makovc 3 38 06 5 38 305 35 30 34 8 50 9 3

POPISNÁ 36 Vypočítejte modus, medá, artmetcký průměr a směrodatou odchylku počtu blzových laloků a prezetujte data pomocí tyčkového dagramu Výsledek: ˆ 3, ~ 3 ;, 76 ; s, 4 7 Počet lístků a lstech jasau Počet lístků 3 5 7 9 3 5 Počet lstů s daým počtem lístků 8 4 876 674 947 753 59 Vypočítejte modus, medá, artmetcký průměr a směrodatou odchylku počtu lístků a lstu Výsledek: ˆ, ~ ; 9, 9 ; s, 85 8 Výčetí tloušťky jedlí Následující sezam zachycuje výčetí tloušťky sto až sto deset let starých jedlí rostoucích a daém staovšt Hodoty tlouštěk jsou uvedey v mlmetrech 47 365 367 340 45 48 3 333 46 85 9 374 368 38 47 55 447 73 3 3 3 4 496 437 37 38 377 34 7 68 47 345 53 34 404 36 36 54 63 59 46 470 533 335 6 34 84 83 456 50 33 380 97 4 78 45 43 5 445 309 96 568 374 59 44 339 459 6 53 96 9 3 34 464 75 367 4 33 96 36 395 69 449 3 75 438 9 300 50 390 380 407 344 48 406 3 88 345 50 445 359 467 404 374 437 558 366 365 305 30 404 453 36 36 63 44 438 463 46 345 307 349 5 54 379 63 549 385 47 54 436 88 344 4 44 387 34 388 304 363 404 496 4 47 333 39 70 365 88 79 34 39 64 307 353 377 36 7 39 33 4 8 5 3 34 77 560 604 57 4 47 78 76 589 76 37 393 40 3 9 0 0 76 45 0 339 44 53 70 36 354 544 3 36 3 335 360 68 346 a) Zazameaá data setřďte a výsledek tohoto setříděí prezetujte grafcky Volte přtom růzou šířku a počátek tloušťkových tříd b) Určete základí statstcké ukazatele (Použjte vhodý tabulkový kalkulátor č soubor statstckých programů) 9 V ásledující tabulce je uvedea hmotost ovorozeých chlapců z chudých číských rod v Sgapuru v letech 950 95 Hmotost jsou měřey 3 v ucích ( uce 8,3495 0 kg ), data jsou přtom pro přehledost sdružea do tříd po osm ucích Hmotost v tabulce odpovídají středům příslušých tříd

37 Hmotost 59,5 67,5 75,5 83,5 9,5 99,5 07,55,5 3,53,5 39,5 47,555,5 63,57,5 Četost 6 39 385 888 79 40 007 33 64 0 74 4 5 Určete modus, medá, artmetcký průměr, rozptyl a směrodatou odchylku hmotostí Korgujte chyby způsobeé setříděím užtím leárí terpolace př výpočtu medáu a Sheppardovy korekce př výpočtu rozptylu