Základy statistiky. Petr Kladivo

Podobné dokumenty
Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Mendelova univerzita v Brně Statistika projekt

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Doc. Ing. Dagmar Blatná, CSc.

a další charakteristikou je četnost výběrového souboru n.

4.2 Elementární statistické zpracování Rozdělení četností

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Metody zkoumání závislosti numerických proměnných

11. Popisná statistika

S1P Popisná statistika. Popisná statistika. Libor Žák

Deskriptivní statistika 1

Generování dvojrozměrných rozdělení pomocí copulí

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

VY_52_INOVACE_J 05 01

Testování statistických hypotéz

P2: Statistické zpracování dat

11. Časové řady Pojem a klasifikace časových řad

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

12. N á h o d n ý v ý b ě r

[ jednotky ] Chyby měření

P1: Úvod do experimentálních metod

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

Úvod do korelační a regresní analýzy

1. Základy měření neelektrických veličin

9. Měření závislostí ve statistice Pevná a volná závislost

, jsou naměřené a vypočtené hodnoty závisle

Odhady parametrů 1. Odhady parametrů

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

Chyby přímých měření. Úvod

LABORATORNÍ CVIČENÍ Z FYZIKY. Měření objemu tuhých těles přímou metodou

8. Zákony velkých čísel

BIVŠ. Pravděpodobnost a statistika

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

Úvod do teorie měření

Spolehlivost a diagnostika

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

APLIKOVANÁ STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

SOUKROMÁ VYSOKÁ ŠKOLA EKONOMICKÁ ZNOJMO. Statistika I. distanční studijní opora. Milan Křápek

Pravděpodobnostní modely

Přednáška č. 2 náhodné veličiny

Náhodný výběr 1. Náhodný výběr

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

Elementární zpracování statistického souboru

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy

Intervalové odhady parametrů některých rozdělení.

12. Neparametrické hypotézy

ZÁKLADY PRAVDĚPODOBNOSTI A STATISTIKY

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

Statistika - vícerozměrné metody

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

Optimalizace portfolia

PRAVDĚPODOBNOST A STATISTIKA

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Přednáška V. Úvod do teorie odhadu. Pojmy a principy teorie odhadu Nestranné odhady Metoda maximální věrohodnosti Průměr vs.

Soustava momentů. k s. Je-li tedy ve vzorci obecného momentu s = 1, získáme vzorec aritmetického průměru.

Výukový modul III.2 Inovace a zkvalitnění výuky prostřednictvím ICT

PRAVDĚPODOBNOST A STATISTIKA

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Momenty a momentové charakteristiky

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

1 EXPLORATORNÍ ANALÝZA PROMĚNNÝCH. Čas ke studiu kapitoly: 120 minut. Cíl: Po prostudování této kapitoly budete umět použít

Pravděpodobnost a aplikovaná statistika

1.3. ORTOGONÁLNÍ A ORTONORMÁLNÍ BÁZE

PRAVDĚPODOBNOST A STATISTIKA

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

9. Základní statistické pojmy.

Lineární regrese ( ) 2

7 LIMITNÍ VĚTY. Čas ke studiu kapitoly: 70 minut. Cíl:

Střední hodnoty. Aritmetický průměr prostý Aleš Drobník strana 1

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

PRAVDĚPODOBNOST A STATISTIKA

6. Posloupnosti a jejich limity, řady

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

Téma 6: Indexy a diference

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

STATISTICKÉ MINIMUM PRO STUDENTY BAKALÁŘSKÉHO STUDIA NA TECHNICKÝCH OBORECH BOHUMIL MINAŘÍK

POPISNÁ STATISTIKA. Předmět popisné statistiky

V. Normální rozdělení

Matematika I, část II

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2

USTÁLENÉ PROUDĚNÍ V OTEVŘENÝCH KORYTECH

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

ZÁKLADY STAVEBNÍ MECHANIKY

2. Vícekriteriální a cílové programování

Komplexní čísla. Definice komplexních čísel

Testy statistických hypotéz

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

Náhodné jevy, jevové pole, pravděpodobnost

Transkript:

mm Základy statstky Petr Kladvo

Uverzta Palackého v Olomouc Přírodovědecká fakulta Základy statstky Petr Kladvo Olomouc 03

Opoet: RNDr. Šárka Brychtová, Ph.D. RNDr. Mloš Fňukal, Ph.D. Mgr. Petr Zemáek, Ph.D. Název projektu: Rozšířeí akredtace studa učtelské geografe a PřF UP v Olomouc o kombovaou formu Reg. číslo: CZ..07/..00/8.004 Neoprávěé užtí tohoto díla je porušeím autorských práv a může zakládat občaskopráví, správěpráví, popř. trestěpráví odpovědost.. vydáí Petr Kladvo, 03 Uverzta Palackého v Olomouc, 03 ISBN 978-80-44-384- (tštěá verze) ISBN 978-80-44-384-9 (ole verze)

Obsah Obsah...3 Úvod...5 Vysvětlvky k koám...6 Základí statstcké pojmy...7. Statstka, popsá statstka, statstka v geograf...7. Základí pojmy...7.. Statstcká jedotka...8.. Statstcký zak...8..3 Statstcký soubor...9 Tříděí dat a rozděleí četostí.... Četost..... Absolutí, relatví a kumulatví četost.... Tříděí dat do tervalů..... Itervaly a jejch parametry, termologe..... Prcp tříděí dat....3 Grafcké vyjádřeí rozděleí četostí...3.3. Hstogram...3.3. Polygo...3.3.3 Součtová čára...4 3 Základí statstcké charakterstky...7 3. Charakterstky úrově, polohy...7 3.. Středí hodoty...7 3.. Kvatly...0 3. Charakterstky varablty... 3.3 Charakterstky škmost...4 3.4 Charakterstky špčatost...5 4 Teore rozděleí...8 4. Náhodá velča...8 4. Teoretcké rozděleí áhodé velčy...8 4.. Normálí (Gaussovo) rozděleí...9 4.. Bomcké rozděleí...3 5 Odhady parametrů...36 5. Prcp odhadů...36 5.. Bodové odhady...37 5.. Itervalové odhady...38

6 Testováí statstckých hypotéz... 4 6. Prcp testováí... 4 6.. χ test... 43 6.. F-test... 44 6..3 t-test... 44 7 Závslost mez áhodým velčam... 47 7. Korelačí počet... 47 7. Regresí aalýza... 49 8 Vybraé statstcké metody... 5 8. Časové řady... 5 8. Kocetrace jevu v prostoru... 55 8.3 Trojúhelíkový graf (Ossaův trojúhleík)... 56 Závěr... 60 Použté zdroje... 6 Profl autora... 6

Úvod Hlavím cílem učebího tetu je poskytout čteář přehledý materál, který mu poskyte možost se sezámt se základím statstckým metodam uplattelým v geograf. Tet je systematcky rozčleě tak, aby v přehledé formě poskytul jedak ezbytý teoretcký a metodologcký rámec, ale současě vysvětll možost aplkace probíraých metod a kokrétích geografckých úlohách. Jedotlvé kaptoly jsou proto doplěy řešeým cvčeím a dále příklady, a kterých s studet může aplkace vyzkoušet samostatě. Každý vysvětlovaý příklad aplkace má jasě a podrobě popsaý postup a studetům objasňuje důležtá metodologcká rozhodutí. Částečou předlohou a sprací učebího tetu jsou publkace Brázdl R. a kol. (995): Statstcké metody v geograf cvčeí a Hedl (009): Přehled statstckých metod, obzvlášť pro kaptoly 5 a 6, jejchž část byla převzata a doplěa aplkacem a příklady pro potřeby tohoto tetu. Čteář bude postupě sezáme se základím statstckým pojmy, základím charakterstkam statstckých souborů, aby je mohl vzájemě srovávat (zejméa ukazatel polohy a varablty dat). Následovat bude teore espojtých spojtých rozděleí áhodých velč se zaměřeím a jejch geografcké aplkace, dále se aučí posuzovat statstckou výzamost dosažeých výsledků prostředctvím testováí hypotéz. Velký důraz bude klade a získáí zalostí v oblast korelačího počtu a regresí aalýzy, protože schopost posouzeí těsost vztahu mez dvěma proměým a jeho matematcké vyjádřeí patří k základím dovedostem geografů. Kromě kokrétích statstckých metod se sezámíme s jejch prcpy, základím předpoklady pro jejch použtí a také omezeím plyoucím z jejch specfk. Z důvodu zachováí přehledost a celkové vypovídací hodoty učebího tetu obsahuje teoretcká část je ezbytě uté vědomost. Proto je a koc zařazea kaptola věující se jedoduché rešerš a přehledu zdrojů, lteratury a odkazů a místa, kde je možé dohledat podrobější statstcko-matematcké souvslost. Závěr skrpta je doplě o kaptolu věující se základím aalýzám časových řad, které přestavují podstatou část metod geografckých výzkumů, tet je avíc obohace o ukázky grafcké terpretce dosažeých výsledků, a kterou se v deší době klade emalý důraz. Smyslem je, aby studet prohloubl své geografcké zalost a vímáí, aby postřehl souvslost mez geografckým jevy, porozuměl jedotlvým úlohám, aby pro jejch vyřešeí vybral vhodou metodu, porozuměl způsobu jejího použtí, byl schope j aplkovat pro odlšý případ a především terpretovat korektě její výsledky. Předpokládaé vstupí zalost Tet je št a míru studetům, kteří absolvoval gymázum, předpokládá proto zvládutí středoškolského učva. Autoř dále u svých čteářů očekávají předchozí absolvováí vysokoškolského studjího předmětu Úvod do studa geografe. Písemé úkoly, které budete v předmětu vypracovávat, by proto měly mít formálí obsahovou úroveň odborých tetů (používáí odboré termologe, ctačí aparát, uvážlvý výběr odborých zdrojů, atd.). Písemé kotrolí úkoly, komukace s tutorem Během semestru studet zpracují v písemé formě 6 kotrolích úkolů (dva dlouhé a čtyř krátké). S těmto úkoly budou sezáme tutorem a prvím setkáí. K odevzdáváí úkolů, k dskuzím s kolegy a k dotazům tutorov budou studet využívat e-leargový portál katedry geografe Přírodovědecké fakulty UP v Olomouc, který je dostupý a teretové adrese http://geomoodle.upol.cz/. Výukový portál katedry tak tvoří orgacký doplěk této studjí opory.

Vysvětlvky k koám Průvodce studem Prostředctvím průvodce studem k vám promlouvá autor tetu. V průběhu četby vás upozorňuje a důležté pasáže, abízí vám metodckou pomoc a ebo předává důležtou vstupí formac ke studu kaptoly. Příklad Příklad objasňuje probíraé učvo, případě propojuje získaé zalost s ukázkou jejch praktcké aplkace. Úkoly Pod koou úkoly ajdete dva druhy úkolů. Buď vás autor vybíde k tomu, abyste se ad ějakým problémem zamyslel a uvedl svůj vlastí ázor a položeou otázku, ebo vám zadá úkol, kterým prověřuje získaé zalost. Správé řešeí zpravdla ajdete přímo v tetu. Pro zájemce Část pro zájemce je určea těm z vás, kteří máte zájem o hlubší studum daé problematky. Najdete zde odkazy a doplňující lteraturu. Pasáže úkoly jsou zcela dobrovolé. Řešeí V řešeí můžete zkotrolovat správost své odpověd a kokrétí úkol ebo v ěm ajdete řešeí kokrétího testu. Váže se a kokrétí úkoly, testy! Neajdete zde databáz správých odpovědí a všechy úkoly a testy v tetu! Shrutí Ve shrutí s zopakujete klíčové body probíraé látky. Zjstíte, co je pokládáo za důležté. Pokud shledáte, že ěkterému úseku erozumíte, ebo jste učvo špatě pochopl, vraťte se a příslušou pasáž v tetu. Shrutí vám poskyte rychlou korekc! Kotrolí otázky a úkoly Prověřují, do jaké míry jste pochopl tet, zapamatoval s podstaté formace a zda je dokážete aplkovat př řešeí problémů. Najdete je a koc každé kaptoly. Pečlvě s je promyslete. Odpověd můžete ajít ve více č méě skryté formě přímo v tetu. Někdy jsou tyto otázky řešey a tutorálech. V případě ejasostí se obraťte a svého tutora. Pojmy k zapamatováí Najdete je a koc kaptoly. Jde o klíčová slova kaptoly, která byste měl být schop vysvětlt. Po prvím prostudováí kaptoly s je zkuste ejprve vyplt bez ahlédutí do tetu! Teprve pak srovejte s příslušým formulacem autora. Pojmy slouží eje k vaší kotrole toho, co jste se aučl, ale můžete je velm efektvě využít př závěrečém opakováí před testem.

7 Základí statstcké pojmy Cíl Po prostudováí této kaptoly budete umět: posoudt pozc statstky ke geografckým dscplíám, vysvětlt objekty studa statstky v geograf, rozlšovat věcé, prostorové a časové atrbuty statstckých zaků, jedotek. Doba potřebá k prostudováí kaptoly: 45 mut. Průvodce studem V prví kaptole s řekeme o ezbytost statstky pro studum geografckých jevů, sezámíme se s předmětem jejího studa a termologcky s zakotvíme základí statstcké pojmy tak, abychom s m mohl v průběhu dalšího studa pracovat.. Statstka, popsá statstka, statstka v geograf Statstka je vědím oborem, který se zabývá zkoumáím jevů, které mají hromadý charakter. Zkoumaý jev tedy musí příslušet určté část velkého možství prvků (předmětů, osob, událostí apod.), ebo musí být dáa možost opakovaě získat požadovaé formace o zkoumaém jevu za podmíek, za chž jev může astat. Statstka se pak zabývá zjšťováím, zpracováím, rozborem, hodoceím a výkladem údajů o tomto jevu. Tyto údaje shromažďujeme za účelem popsu rozsáhlých souborů, ebo k redukc rušvých odchylek způsobovaých jevy jým ež je sledovaý jev. Statstku rozdělujeme a deskrptví, jejímž cílem je hlavě pops a matematckou, která čerpá z teore pravděpodobost. Popsá (deskrptví) statstka se zabývá popsem stavu ebo vývoje hromadých jevů. Nejprve se vymezí soubor prvků, a chž se bude uvažovaý jev zkoumat. Následě se všechy prvky vyšetří z hledska studovaého jevu. Výsledky šetřeí kvaltatví kvattatví, vyjádřey především číselým popsem tvoří obraz studovaého hromadého jevu vzhledem k vyšetřovaému souboru. Z popsé statstky se postupem času vyčlely dílčí statstcké dscplíy, z chž zřejmě ejvýzamější je matematcká statstka, která je založea především a teor pravděpodobost. Popsá statstka Matematcká statstka Statstka se prolíá praktcky všem dílčím geografckým dscplíam, které z jejích výsledků čerpají. Statstka v geograf pak je dílčí geografckou dscplíou, která a geografcké jevy s hromadým charakterem (fyzcko-geografcké, socálí, ekoomcké, demografcké aj.) aplkuje pozatky popsé a matematcké statstky. Ve své podstatě tak tvoří osou platformu pro praktcky všechy geografcké subdscplíy, které z jejích metod čerpají.. Základí pojmy Mez základí statstcké pojmy, se kterým budeme v celém učebím tetu pracovat, jsou: statstcká jedotka, statstcký zak a statstcký soubor.

8.. Statstcká jedotka Statstckou jedotkou rozumíme základí, přesě vymezeý objekt, prvek, ebo jev, který je předmětem pozorováí, resp. statstckého šetřeí. Přesé vymezeí statstcké jedotky spočívá v jejím určeí ve smyslu věcém, časovém a prostorovém... Statstcký zak Každý statstcký zak je věcě, časově a prostorově vymeze a je ezbyté toto v praktckých úlohách zohledňovat a respektovat. Statstckým zakem je charakterstka ěkteré z vlastostí statstcké jedotky. Tyto charakterstky, kterým můžeme rověž rozumět měřtelé projevy jejch vlastostí, rozlšt do tří kategorí (vz obr. ) a zaky prostorové, věcé a časové. Statstcké zaky jsou: věcé časové kvattatví kvaltatví alteratví možé prostorové Obr. Statstcké zaky (Prame: autor). Atrbut prostoru v podstatě zameá lokac studovaé vlastost statstcké jedotky, zaky časové její časové zařazeí a zaky věcé vyjadřují kvattatví č kvaltatví ukazatel. Přtom kvattatví zameají měřtelé údaje daé jedotky (ptáme se kolk ebo jak velká, vysoká, ) apř. výška, hmotost, zsk, objem výroby, počet zaměstaců), zatímco kvaltatvím zaky rozlšujeme vlastost, které ejsou měřtelé. Alteratví zaky mohou abývat pouze dvou hodot (ptáme-l se apř. a pohlaví), možé pak více hodot (apř. zjšťujeme-l árodost, ábožeství atd.). Pomocí shodých (společých) zaků statstckých jedotek vymezujeme jejch příslušost ke statstckým souborům. Příklad / Příklad z prae Zaměřme se a Sčítáí ldu, domů a bytů. Statstckým jedotkam jsou osoby, domácost ebo apř. byty a domy. Statstckým zakem pak může být věk, árodost, bydlště, pohlaví, počet čleů domácost, stáří domu, vybaveost bytu apod. Dalším příkladem statstcké jedotky může být průmyslový podk se statstckým zaky apř. ročí obrat, počet zaměstaců, odvětví podkáí, průměrá mzda zaměstaců apod. Jako příklady statstckých jedotek z fyzcké geografe uveďme teplota vzduchu v určtý čas a určtém místě, podobě průtok, stav vodí hlady, tlak vzduchu, srážkový úhr apod. Úkol / Úkol k zamyšleí Uveď příklady statstckých jedotek a zaků z růzých geografckých dscplí.

9..3 Statstcký soubor Statstckým souborem rozumíme souhr statstckých jedotek stejého druhu. Soubory jsou rověž jedozačě časově, věcě a prostorově vymezey. statstcká jedotka základí soubor (rozsah N) Rozsah výběrového souboru ozačujeme, základího N. Obr. Základí a výběrový statstcký soubor (Prame: autor). výběrový soubor (rozsah ) Rozsahem souboru (ozačujeme, jedá-l se o základí soubor N) rozumíme počet jedotek, které obsahuje. Za základí soubor považujeme takový, který obsahuje všechy statstcké jedotky, a které se vztahuje statstcké šetřeí (jeho rozsah může být koečý, ebo ekoečý). Výběrový soubor je pak část (výběr) ze základího souboru. Jedotky výběrového souboru vybíráme ze základího souboru buď áhodě (áhodý výběr), ebo podle určtých pravdel. Příklad / Příklad z prae Za základí statstcký soubor můžeme prohlást apříklad počet obyvatel v České republce k. 3. 00 (SLDB 00). Jeho rozsah je N = 0 30 060 (ČSÚ). Výběrových souborů z tohoto základího souboru je celá řada. Uveďme apř. počet obyvatel v Pardubckém kraj ( = 508 8), počet že v ČR ( = 5 47 989), počet obyvatel ve věku 0 až 9 let ( = 708 699), počet rozvedeých mužů ( = 35 079), počet obyvatel romské árodost ( = 746), počet věřících obyvatel ( = 3 88 088) atd. Z těchto výběrových souborů se dají vybírat další dílčí soubory s ještě meším rozsahem. Pro zájemce tatstcké zaky lze kategorzovat do jých kategorí založeých ale a podobých prcpech. Příklad takového tříděí je apř. ásledující (podle stupě kvatfkace): ) zaky omálí, u kterých lze terpretovat pouze rovost (pohlaví, barva plet, árodost aj.); ) zaky ordálí, tzv. pořadové zaky (školí klasfkace, pořadí určeé a základě hodoceí - počtu bodů); 3) zaky metrcké (též kardálí), charakterstcké přesě apř. aměřeou hodotou, lze u ch přesě posoudt rozdíl mez hodotam (o kolk se lší), patří sem apříklad teplota, tlak, ale rozloha, plocha povodí, počet obyvatel, HDP/obyv. apod. SHRNUTÍ Úkolem statstky v geograf je studum hromadých geografckých jevů prostředctvím statstckých souborů, ve kterých jsou seskupey statstcké jedotky stejého druhu. Popsá část statstky tyto soubory vyhodocuje především pomocí jejch číselých charakterstk, matematcká ebo pravděpodobostí statstka pak posuzuje vztahy, rozdíly a závslost mez statstckým soubory resp. mez hromadým jevy a saží se je zobect.

0 Kotrolí otázky a úkoly. Uveď kokrétí příklady věcého, kvaltatvího, alteratvího statstckého zaku.. Jaký je vztah mez základím a výběrovým statstckým souborem? 3. Statstckou jedotkou je měsíčí úhr srážek v Olomouc. Měřeí provádím v letech 00 a 00. Jaký bude rozsah souboru získaých hodot? Pojmy k zapamatováí Pojem : statstcká jedotka, statstcký zak a jejch určeí a typy Pojem : základí a výběrový statstcký soubor Pojem 3: rozsah souboru, áhodý výběr

Tříděí dat a rozděleí četostí Cíl Po prostudováí této kaptoly budete umět: rozlšovat pojmy absolutí, relatví, kumulatví četost, roztřídt data do optmálího počtu tervalů, tabulkově a grafcky prezetovat rozložeí četostí ve statstckém souboru. Doba potřebá k prostudováí kaptoly: 60 mut. Průvodce studem Představme s rozsáhlý statstcký soubor, apř. obce České republky s jejch počtem obyvatel. Rozsah takového souboru je = 6 5. Pro jeho přehledou grafckou prezetac je třeba taková data kategorzovat, roztřídt obce do tervalů podle počtu obyvatel. Podle jakých krtérí třídíme data do tervalů, jak výsledky prezetujeme a jakých pravdel se máme držet, s řekeme v ásledující kaptole.. Četost Četostí rozumíme počet prvků se stejou hodotou statstckého zaku (každý statstcký soubor tak geeruje své rozděleí četostí) ebo četostí myslíme počet prvků s hodotam zaku patřícím do určtého tervalu (ebo třídy) pak se bavíme o tzv. skupovém (tervalovém) rozděleí četostí... Absolutí, relatví a kumulatví četost Absolutí četost (ozačujeme ) vyjadřuje absolutí hodotou četost zastoupeých hodot ve statstckém souboru, resp. v daém tervalu. Relatví četost vyjadřuje četost pomocí relatvích hodot, výpočet je dá vztahem: f Absolutí četost budeme ozačovat, relatví f. f =, tj. je dáa podílem jedotlvých absolutích četostí k rozsahu souboru. Může být uvedea desetým číslem, ebo procetuálě. Kumulatví četost absolutí N, resp. relatví F udávají úhrou četost statstckých jedotek s hodotam zaku meším, ebo rovým hodotě zaku ebo horí hrac tervalu, př seřazeí hodot ebo tervalů podle pořadí eklesajících hodot zaku. Kumulovaou četost lze vyjadřovat a počítat z absolutích četostí z relatvích četostí.

. Tříděí dat do tervalů.. Itervaly a jejch parametry, termologe Hrace tervalu ebol mez tervalu, ať už horí ebo dolí, určuje, které hodoty do tervalu patří. Délka tervalu ebo též rozpětí č šířka je rozdíl (kladý) dvou po sobě ásledujících dolích (ebo horích) hrac tervalů. Střed tervalu ozačujeme s je důležtou hodotu, která př výpočtech z tervalového rozděleí četostí zastupuje příslušý terval. Střed tervalu spočítáme jako artmetcký průměr horí a dolí hrace tervalu, ebol: (a+b) :, kde a (b) je dolí (horí) hrace tervalu. Typologe tervalů <a; b> uzavřeý terval, moža všech, pro která platí a b (a; b) otevřeý terval, moža všech, pro která platí a < < b <a; b) uzavřeý terval zleva, moža všech, pro která platí a < b (a; b> uzavřeý terval zprava, moža všech, pro která platí a < b.. Prcp tříděí dat Jak třídíme data? Jedotlvé tervaly, do kterých sledovaý statstcký soubor rozdělíme, vzkou roztříděím jeho hodot podle určtých krtérí: každý terval je přesě vymeze svojí horí a dolí hrací, jsou vymezey tak, aby šel každý prvek jedozačě zařadt, tervaly se esmí překrývat, šířka tervalů by měla být stejá (pro sadější výpočty), počet tervalů volt optmálě ( a málo, a přílš ). Jak rozdělt data do tervalů? Eaktí pravdla pro určeí optmálího počtu tervalů eestují, celý algortmus bude vždy obsahovat subjektví prvek. Přesto se setkáme s doporučeím, jak postupovat, ásledující algortmus představuje jedo z ch: určíme R jako rozdíl mez mamálí a mmálí hodotou (jedá se o varačí rozpětí) sledovaého souboru, tz. R = m, výpočet počtu tervalů (tříd) ozačme k rozdělíme a tř případy: o je-l rozsah souboru > 00, pak k = 0 log... () ma o je-l rozsah souboru 40 < 00, pak k =... () o je-l rozsah souboru 40, pak k = +,446 l... ()

3 výpočet šířky tervalu h je pak dá vztahem: R h =. k Jak už bylo uvedeo výše, volba počtu tervalů se těmto pravdly emusí řídt, může být tutví, provedeá a základě aalýzy struktury studovaých dat ebo a základě zkušeostí..3 Grafcké vyjádřeí rozděleí četostí Zjštěé četost ejpřehleděj uvádíme v tabulkách tervalového (skupového) rozděleí četostí vz tab.. Pro přehledost, adhled, ebo lepší oretac prezetujeme data z těchto tabulek grafcky, ejčastěj pomocí hstogramu, polygou a součtové čáry..3. Hstogram Hstogram je graf vyjadřující rozložeí četostí ve statstckém souboru. Jedá se o graf sloupcový, př jeho kostrukc ezáleží a tom, zda jako zdrojová data uvažujeme absolutí, ebo relatví četost (pro oba způsoby vypadá dagram stejě). Na vodorovou osu aášíme tervaly v příslušých jedotkách, a ose svslé y se vyáší absolutí (relatví) četost. Jak jž bylo řečeo, jedé se o sloupcový graf, kde šířce sloupce odpovídá délka (šířka) tervalu a výšce pak četost v daém tervalu. Z vhodě sestrojeého hstogramu lze vypozorovat rozložeí hodot ve statstckém souboru, jejch rozmístěí okolo středí hodoty, rověž jejch rozptyl v souboru a dají se určt další charakterstky, jako apříklad modálí terval aj. Hstogramem rozumíme sloupcový graf prezetující četost. Můžeme ho sestrojt z četostí absolutích relatvích, tvar bude mít stejý..3. Polygo Polygo je obdobou hstogramu, také vyjadřuje rozložeí četostí ve statstckém souboru, lší se pouze typem grafu. Zatímco v případě hstogramu se jedá o sloupcový graf, u polygou jde o spojcový typ grafu. Z vlastostí polygou vyplývá, že v případě jeho sestrojeí z relatvích četostí ohračuje křvka polygou plochu o velkost (v případě vyjádřeí v procetech pak 00 %). Rozdíl mez polygoem a hstogramem je pouze v typu grafu. Polygo hstogram tak zázorňují stejé údaje poěkud odlšým způsobem, ezáleží a výběru z absolutích ebo relatvích četostí. Obr. 3 Ukázka hstogramu a polygou četostí (Prame: autor).

4.3.3 Součtová čára Součtovou čarou prezetujeme kumulatví četost, lze využít hstogram kumulatvích četostí. Součtová čára slouží pro zázorěí kumulovaých četostí. Př kostrukc se vyáší hodoty kumulovaých četostí (ezáleží a tom, zda absolutí, č relatví, ale častěj se používají relatví) k horím hracím tervalů, body se spojí lomeou čarou. Z grafu součtové čáry lze vyčíst řadu charakterstk, mj. hodoty kvartlů, medá atd. Obr. 4 Ukázky součtové čáry, vpravo s vyzačeím medáu (Prame: autor). Pro zájemce Určt optmálí počet tervalů a jejích šířku závsí a povaze problematky, resp. jevu, který aalyzujeme. Zpravdla se řídíme tím, aby měly všechy tervaly, do kterých data třídíme kostatí šířku, tj. aby byly všechy stejě velké, což praktcké vzhledem k výpočtům prezetac datového souboru. Setkáme se ale s řadou případů, kdy toto pravdlo dodržet elze. Ukázkovým příkladem je tříděí obcí České republky do tervalů podle počtu obyvatel. Je zřejmé, že př řešeí takovéto úlohy musíme počet tervalů a jejch velkost, resp. hrace, určt uměle, dodržet kostatí šířku tervalů je evhodé. Příklad / Příklad z prae Máme k dspozc fktví data mzdy (v ts. Kč) 30 zaměstaců frmy (vz tab. ). Data vhodě roztřďte do tříd, grafcky a tabulkově prezetujte. Tab. Data pro příklad. 5 9 7 5 3 8 7 8 5 7 7 6 4 8 3 8 3 0 6 3 9 9 Prame: Autor. Řešeí: Pro určeí optmálího počtu tervalů k použjeme vztah (), protože rozsah souboru = 30. Tedy k = +,446. l30 = 5,9. Data tedy roztřídíme do šest tříd, varačí rozpětí R = m ma = 3 8 = 3. Šířka tervalů h = 3 : 6 = 3,8. Vzhledem k povaze dat může pracovat s šířkou tervalů 4. Začeme-l mmálí hodotou 8, dostaeme prví terval (8; >. Zkostruujeme zbývající tervaly, roztřídíme do ch původí hodoty a spočítáme četost příslušé jedotlvým tervalům (vz tab. ).

5 Tab. Řešeí příkladu. Prame: Autor. Mzda (ts. Kč) s N f (%) F (%) (8 ; > 0 3 3 0,0 0,0 ( ; 6 > 4 5 8 6,7 6,7 (6 ; 0 > 8 8 6 6,7 53,3 (0 ; 4 > 9 5 30,0 83,3 (4 ; 8 > 6 3 8 0,0 93,3 (8 ; 3 > 30 30 6,7 00,0-30 - 00,0 - Obr. 5 Prezetace eroztříděého (ahoře) a roztříděého souboru. (Prame: autor). Příklad / Příklad z prae Mulý příklad byl ukázkou tříděí dat do stejě velkých tervalů, setkáme se ale také s tříděím do tervalů s růzou šířkou, typcká ukázka vz obr. 6. Obr. 6 Ukázka tříděí dat do estejě velkých tervalů. (Prame: autor, data ČSÚ).

6 Úkol / Úkol k zamyšleí Máte k dspozc statstcký soubor (vz íže) fktví data o průměré ročí teplotě a meteorologcké stac. Data roztřďte do tervalů a tabulkově grafcky je prezetujte (hstogram, součtová čára). 7,4 8,3 8,5 0,9 7,9 0,8 9,9 9,4 9,3 8,5 9,6 9,4 8, 9,7 8,4 9,4 0,7 8,8 9,5 9,0 8, 0,3 7,7 8,8 8,6 9,8 9,4 8,9 9,6 9, 9, 9,9 0,0 8,9 0, 9,3 9,6 8,7 9,9 9,4 7,9 0,, 9,3 0,5 8,5 9, 9, 8,8 9,6 Doporučeí: Zvolte šířku tervalu h = 0,5 C, jako dolí hrac prvího tervalu zvolte teplotu 7,0 C. SHRNUTÍ Umět rozdělt údaje ze statstckého souboru do tříd patří k elemetárím dovedostem práce s daty. K určeí optmálího počtu tervalů, do kterých třídíme, lze využít ěkteré z estujících algortmů, často se však jedá o záležtost subjektví, která vychází buď z doporučeí, ebo ze zkušeostí. Nedílou součástí celého procesu je korektí tabulková a grafcká prezetace ať už eroztříděých ebo roztříděých statstckých souborů. Kotrolí otázky a úkoly. Čemu je rove součet všech absolutích ( ) a relatvích (f ) četostí ve statstckém souboru?. Jaký je rozdíl mez polygoem a součtovou čárou? 3. Uveď příklady z geografe, kde se ehodí třídt data do tervalů se stejou šířkou. Pojmy k zapamatováí Pojem : četost, absolutí, relatví, kumulatví četost Pojem : hstogram, polygo, součtová čára Pojem 3: varačí rozpětí, horí, dolí hrace a střed tervalu

7 3 Základí statstcké charakterstky Cíl Po prostudováí této kaptoly budete umět: vypočítat a okometovat číselé charakterstky statstckých souborů, a základě vypočítaých hodot mez sebou statstcké soubory porovat, vybrat reprezetatví číselé charakterstky pro statstcký soubor. Doba potřebá k prostudováí kaptoly: 0 mut. Průvodce studem Jedím ze základích úkolů statstky je schopost porováváí statstckých souborů mez sebou. Jedou z varat je prezetace rozložeí četostí v těchto souborech, kterou jsme s uvedl v mulé kaptole. Další možostí je srováváí pomocí číselých charakterstk, o kterém s řekeme yí. Číselou charakterstkou rozumíme hodoty (průměry, odchylky apod.), které ám budou statstcké soubory reprezetovat, a a jejch základě budeme schop soubory porovávat. Probereme s čtyř základí skupy statstckých charakterstk, budou to charakterstky úrově (též polohy), charakterstky varablty, charakterstky škmost a koečě charakterstky špčatost. Součástí této kaptoly budou vzorce, podle kterých se jedotlvé číselé charakterstky počítají. Termologe a symbolka, kterou budeme dále používat: Neroztříděý statstcký soubor: prvek statstckého souboru (statstcká jedotka), rozsah souboru; soubor se tedy skládá z prvků,,,. Roztříděý statstcký soubor: četost příslušého tervalu (apř. četost prvího tervalu), s střed příslušého tervalu (apř. s střed prvího tervalu), k počet tervalů, do kterých jsou data roztříděa, rozsah souboru. 3. Charakterstky úrově, polohy Statstckým charakterstkam (ukazatel) úrově, resp. polohy statstckého souboru, rozumíme hodoty zkoumaého zaku, které udávají velkost jevu v daém souboru a udávají polohu četostí. Slouží k porováváí dvou více souborů, charakterstky úrově vlastě zastupují všechy hodoty statstckého souboru (typcky apř. artmetcký průměr). Nejčastěj používaým charakterstkam úrově jsou středí hodoty (průměry, modus, medá apod.), dále sem řadíme apř. kvatly (kvartly, decly, percetly). 3.. Středí hodoty Středí hodoty patří k ejdůležtějším a ejpoužívaějším charakterstkám statstckých souborů vůbec. Obzvlášť průměr, modus a medá. O středích hodotách se bavíme v případě růzých druhů průměrů (artmetcký, harmocký, geometrcký, vážeý), řadíme sem také modus, medá a artmetcký střed.

8 Artmetcký průměr Je patrě ejpoužívaější statstckou charakterstkou, jejíž výpočet je velm jedoduchý jde o úhr hodot statstckého zaku, děleý rozsahem souboru: = =. Mez základí vlastost artmetckého průměru patří: algebracký součet všech odchylek jedotlvých hodot zaku od artmetckého průměru je rove ule, je-l zak kostatí, průměr je rove této kostatě, přčteme-l ke všem hodotám zaku kostatu k, zvětší se průměr o tuto kostatu, vyásobíme-l všechy hodoty zaku kostatou k, je průměr k-krát větší. Typcký průměr alespoň přblžě vysthuje ejčastější hodotu v souboru, etypcký kolv. Kromě té výhody, že výpočet artmetckého průměru je velm jedoduchý, má tato charakterstka ěkteré evýhody, a to zejméa tu, že emusí vždy podávat správou formac. Může být zkresle etrémí (výrazou mamálí ebo mmálí) hodotou v případě, že vycházíme ze souboru s žším rozsahem, rověž rozděleí hodot v souboru může mít dva ebo více vrcholů, a ty jedím ukazatelem elze popsat. Pak mluvíme o typckém průměru kdy je větša hodot souboru blízká průměru a aopak o etypckém průměru. Obr. 7 Statstcký soubor (bmodálí) s tzv. etypckým průměrem. (Prame: autor). Vážeý artmetcký průměr Vážeý průměr se využívá v případě, kdy prvky statstckého souboru mají růzou důležtost, tj. že každému prvku statstckého souboru je přřazea jeho váha. Typckým, když egeografckým příkladem jsou získaé zámky ze zkoušek absolvovaých předmětů, váham pak jsou kredty příslušé těmto předmětům. Vážeý průměr dostaeme jako součet součů prvků a jejch vah děleý celkovým součtem vah, tj. ze vztahu: k = = k =

9 Pro výpočet artmetckého průměru roztříděého statstckého souboru (kdy ezáme vstupí data), se používá právě vážeého průměru, ve vzorc stačí ahradt za s středy tervalů a jedotlvé váhy ( ) jsou vlastě četost příslušé jedotlvým tervalům. Příklad / Příklad z prae Máte k dspozc údaje o počtu zaměstaců podku v jedotlvých mzdových tarfích třídách. Spočítejte průměrou tarfí třídu s využtím vážeého průměru. Tarfí třída 3 4 5 6 7 8 Počet zaměst. 8 8 36 63 46 3 4 Geometrcký průměr Používá se v případech, kdy hodoty tvoří alespoň přblžě geometrckou řadu. Tehdy má smysl uvažovat o použtí geometrckého průměru. V geograf se pomocí geometrckého průměru aalyzují zpravdla časové řady, typckou úlohou je výpočet průměrého tempa růstu. Geometrcký průměr se počítá jako -tá odmoca ze souču všech hodot souboru: Geometrcký průměr využjeme př aalýze časové řady, kokrétě př výpočtu průměrého tempa růstu. =... g. Artmetcký střed Jde spíše doplňkový ukazatel, popřípadě podává prvotí formac o rozložeí hodot ve statstckém souboru. V případě, že jsou hodoty v ěm rozložey rovoměrě, podává poměrě kvaltí formac v tom smyslu, že se artmetcký střed v takovém případě blíží artmetckému průměru. Z jeho vlastí defce (jedá se o artmetcký průměr mamálí a mmálí hodoty v souboru) pak plyou případé evýhody. Je-l mamálí, ebo mmálí hodota výrazě vychýlea č vzdálea od ostatích hodot, eí jeho použtí vhodé a emá přílš velkou vypovídající hodotu. Artmetcký střed sce podává okamžtou formac kde je střed souboru, ale může být výrazě zkresle odlehlou hodotou. ma + m st = Modus Modem azýváme ejčetější (ejčastější) hodotu kvattatvího zaku studovaého souboru, to v případě, že vycházíme z eroztříděého souboru, tedy ze všech jeho hodot. Na prví pohled je tak zřejmé, že pro sadé alezeí modu je vhodé seřadt hodoty zaku vzestupě ebo sestupě. V případě souboru roztříděého do tervalů hovoříme o tervalu s ejvětší četostí jako o modálím tervalu a hodotu modu (přblžou) jsme schop spočítat pomocí ásledujícího vzorce: ˆ = L + h, + kde L je dolí hrace modálího tervalu, h je šířka modálího tervalu, je četost tervalu, který předchází modálímu a je četost tervalu, který ásleduje po modálím.

0 Důležtost modu se projeví př vystžeí typcké hodoty zaku v daém souboru a ásledě př porováváí typckých hodot souborů. Medá Medá Medá je prvek řady (hodot sledovaého zaku), uspořádaé v eklesajícím (rostoucím) pořadí, který j rozděluje a dvě část v tom smyslu, že polova prvků této řady má meší hodotu zaku a polova má větší hodotu zaku, ež je hodota medáu. Jým slovy lze prohlást, že za medá považujeme hodotu, která ám dělí vzestupě seřazeé hodoty statstckého souboru a dvě stejé polovy. Ozačujeme ho ~ 50. Má-l soubor rozsah a jeho hodoty jsou vzestupě uspořádaé, pak je, v případě, že je lché, medá hodota, která má pořadové číslo +. Pro sudé za medá považujeme artmetcký průměr hodot, které se achází a pozcích a + Výhodou medáu je, že zachycuje úroveň (polohu) hodot lépe ež průměr.. Příklad / Příklad z prae Vypočítejte artmetcký průměr, artmetcký střed a určete modus a medá ze vstupích dat z příkladu a str. 4. 3.. Kvatly Hodoty kvatlů formují o rozložeí dat ve vzestupě seřazeém statstckém souboru. Kvatly se řadí mez charakterstky úrově, středí hodotou je však pouze jede z ch, a to medá. Kvatly obecě fugují a stejém prcpu jako medá. Jak jž bylo uvedeo, za medá považujeme hodotu, která dělí vzestupě seřazeé hodoty statstckého souboru a dvě stejé polovy. Kvartly jsou takové hodoty, které od sebe oddělují čtvrty vzestupě seřazeých hodot souboru. Jsou tedy celkem tř. Prví (dolí) kvartl odděluje prví čtvrtu hodot od zbylých tří čtvrt, druhý (prostředí) kvartl odděluje prví dvě čtvrty od zbylých dvou a je tedy totožý s medáem, třetí (horí) kvartl odděluje prví tř čtvrty hodot od posledí čtvrty. Obdobě v souboru detfkujeme decly, kterých je v každém statstckém souboru celkem devět a dělí ho a jedotlvé desety, a koečě percetly, které ho dělí a sety. Percetlů je v souboru 99. Ozačeí: ~ 5, ~ 50 a ~ 75.,. a 3. kvartl ~ 0, ~ 0,..., ~ 90.,.,, 9. decl ~, ~,..., ~ 99.,.,, 99. percetl

Obr. 8 Rozložeí kvatlů ve statstckém souboru (Prame: autor). Příklad / Příklad z prae Níže uvedeá data (zdroj: ČSÚ) prezetují počty evěst podle věku v České republce za rok 006. Určete medá věku evěst a. a 3. kvartl. věk počet f F věk počet f F 6 7 0,0003 0,0003 9 3 633 0,0687 0,6384 7 0,0004 0,0007 30 3 050 0,0577 0,696 8 388 0,0073 0,008 3 97 0,0435 0,7396 9 644 0,0 0,003 3 78 0,0337 0,7733 0 054 0,099 0,040 33 43 0,07 0,8004 59 0,030 0,0703 34 07 0,003 0,806 39 0,0405 0,08 35 39 3 87 0,06 0,888 3 795 0,059 0,637 40 44 44 0,0406 0,934 4 3 64 0,0686 0,3 45 49 496 0,083 0,957 5 4 6 0,0779 0,30 50 54 0,09 0,9746 6 4 684 0,0886 0,3987 55 59 779 0,047 0,9893 7 4 77 0,0894 0,488 60+ 564 0,007,0000 8 4 3 0,086 0,5697 celkem 5 860,0000 3. Charakterstky varablty Jedá se o hodoty, které charakterzují stupeň promělvost statstckého zaku (resp. hodot sledovaého jevu) v daém statstckém souboru. Měříme promělvost vzhledem

Platí pro ěj totéž, co pro artmetcký střed. k typcké hodotě souboru, zpravdla vzhledem k průměru ebo medáu. Charakterstky varablty jsou důležtým doplňkem formací, které poskytují středí hodoty. Jak ajít středí odchylku s ejlepší vypovídající schopostí s ukážeme a ásledujícím příkladu: Máme k dspozc statstcký soubor o rozsahu pět hodot: 0; 30; 40; 60; 00. Sado alezeme artmetcký průměr: 0 + 30 + 40 + 60 + 00 = 50 5 Prví možostí, jak hledat průměrou odchylku je kostrukce absolutích odchylek. Jejch evýhodou je (vzhledem k vlastostem artmetckého průměru), že dávají součet 0, tedy jejch průměr je také ulový. Druhou možostí je uvažovat ezáporé hodoty absolutích odchylek (vz obr. 9). Jejch součet je 0 a průměr 4 (0 : 5). Dostáváme tzv. průměrou odchylku. Třetí a z matematckého pohledu ejlepší metodou je výpočet kvadratckých odchylek (absolutí odchylky umocěé a druhou). Jejch průměr 800 (4 000 : 5) azýváme rozptyl statstckého souboru. Pokud teto průměr (800) odmocíme, čímž se vrátíme do původího rozměru dat, dostaeme hodotu 8 a azveme j směrodatou odchylkou. Jedá se o ejčastěj používaou charakterstku varablty a současě tu ejvhodější. Přehled vybraých charakterstk varablty je uvede dále v tetu.. Obr. 9 Kostrukce vybraých odchylek od artmetckého průměru. (Prame: autor). Varačí rozpětí Jde o ejjedodušší ukazatel varablty souboru, určí se jako rozdíl mmálí a mamálí hodoty ve sledovaém souboru, tedy R =. m ma Jedá se o ukazatel jedoduchý, ale protože závsí pouze a dvou etrémích hodotách, emusí být dostatečě výstžý, mamálí a mmálí hodota může být ahodlá. Tato e přílš dokoalá míra varablty slouží především k prví formac o varabltě souboru. Průměrá odchylka Průměré odchylky vyjadřují míru odlšost (varace) od středí hodoty (průměru, medáu). Jsou doplňkovou formací ke středí hodotě a spočítají se jako artmetcký průměr absolutích hodot odchylek (rozdílů) všech hodot zaku od středí hodoty (artmetckého průměru, medáu ). Pokud vydělíme průměrou odchylku středí hodotou (průměrem, ebo medáem), dostaeme relatví bezrozměrou míru.

3 Výpočty průměré odchylky (od průměru, medáu): d = = resp. d ~ = = ~. Výpočet průměré odchylky z tervalového rozděleí četostí: d k s = = k =. Středí dferece Je defováa jako artmetcký průměr absolutích hodot všech možých vzájemých rozdílů jedotlvých hodot sledovaého zaku, Vhodá míra varablty pro soubory s malým rozsahem, v ostatích případech je její výpočet zbytečě pracý: Δ = = j= ( ) j. Rozptyl Rozptyl vypočítáme jako průměr ze čtverců odchylek jedotlvých hodot zaku od jejch artmetckého průměru. Použít můžeme vzorec pro výpočet rozptylu eroztříděého souboru (vzorec vlevo), ebo uvažovat soubor roztříděý do tervalů (vzorec vpravo). s = = Vybraé vlastost rozptylu: ( ) s k ( ) = = k = Rozptyl je ejdůležtější charakterstkou varace hodot zaků ve statstckém souboru. pokud odečteme od všech hodot statstckého souboru stejou kostatu k, rozptyl souboru zůstae ezměě, po vyásobeí všech hodot statstckého souboru stejou kostatu k, rozptyl musíme vyásobt druhou mocou této kostaty. Směrodatá odchylka Směrodatá odchylka představuje ejčastější a ejvhodější charakterstku varablty. V pra se směrodatou odchylkou setkáváme častěj ež s rozptylem, je defováa jako druhá odmoca z rozptylu a vlastě se jedá o míru rozptylu hodot sledovaého zaku kolem průměru.

4 Vzorce pro výpočet směrodaté odchylky z eroztříděého souboru, ebo-l ze všech hodot (vlevo) a z tervalového rozděleí četostí (vpravo). s s = = = ( ) s ( ) = = s = k k = Vybraé vlastost směrodaté odchylky: pokud odečteme od všech hodot statstckého souboru stejou kostatu k, směrodatá odchylka zkoumaého souboru zůstae ezměěa po vyásobeí všech hodot statstckého souboru kostatou k, se směrodatá odchylka musí vyásobt také touto kostatou Varačí koefcet Varačí koefcet je ejpoužívaější relatví mírou varablty. Varačí koefcet je dá poměrem směrodaté odchylky a artmetckého průměru a z defce tohoto poměru plye, že jde o ukazatel (míru) bezrozměrý. s v = v 00 [%] = s Varačí koefcet se uvádí desetým číslem (aplkací vzorce vlevo), ebo po vyásobeí stem v procetech (vzorec vpravo). 3.3 Charakterstky škmost Charakterstkam škmost (symetre, asymetre) myslíme míry (čísla), která charakterzují erovoměré (esouměré) rozložeí četostí ve statstckém souboru. Pomocí ch jsme schop odhadout tvar rozděleí četostí (resp. jeho souměrost, ebo esouměrost), souměré rozděleí četostí má míry škmost ulové. Míra škmost (založeá a varačím rozpětí) Jde o jedoduchou charakterstku škmost co do výpočtu, ale jak je to míra poměrě edokoalá, ovlvěá mamálí a mmálí hodotou souboru, které mohou být ahodlé. Hodoty míry škmost se pohybují v tervalu (-;): s + ~ ma m =. ma m Obdobým ukazatelem je míra škmost založeá a rozpětí kvatlů, jejch společým edostatkem je to, že př výpočtu euvažují hodoty zaku, pouze vybraé etrémí ebo co do polohy výzamé hodoty.

5 Koefcet škmost Tato míra škmost je, a rozdíl od míry škmost založeé a varačím rozpětí, ebo založeé a rozpětí kvatlů, dokoalejším ukazatelem, je defováa jako artmetcký průměr z třetích moc odchylek jedotlvých hodot zaku od artmetckého průměru vyděleý třetí mocou směrodaté odchylky (vz vzorec pro jeho výpočet ze skupového rozděleí četostí): k 3 ( s ) = α =, 3 s přčemž je-l: α > 0, pak je rozděleí četostí zeškmeo doleva (kladá škmost) α = 0, pak je rozděleí četostí souměré (ulová škmost) α < 0, pak je rozděleí četostí zeškmeo doprava (záporá škmost) Obr. 0 Rozložeí četostí ve statstckém souboru ukázky škmost: a) α > 0 (kokrétě 0,83), b) α < 0, (-0,83). (Prame: autor). 3.4 Charakterstky špčatost Jedá se o čísla, která charakterzují kocetrac prvků souboru v blízkost určté hodoty zaku, jejch úkolem je poskytout představu o tvaru rozděleí četostí co do špčatost ebo plochost. Míra kocetrace kolem medáu Tato míra špčatost je, podobě jako míra škmost založeé a varačím rozpětí a míra škmost založeé a rozpětí kvatlů, edokoalý ukazatel, který může být ovlvě ahodlým etrémím hodotam: K ~ ~ ma m =. 75 5 S rostoucím K je rozděleí četostí špčatější (dochází k větší kocetrovaost hodot v okolí medáu), aopak s klesající hodotou K se rozložeí četostí zplošťuje. Koefcet špčatost Dokoalejším ukazatelem ež míra kocetrace kolem medáu je koefcet špčatost. Je defová jako průměrá hodota součtu čtvrtých moc odchylek hodot zaku od art-

6 metckého průměru děleých čtvrtou mocou směrodaté odchylky (vz vzorec pro jeho výpočet ze skupového rozděleí četostí). ε = k = ( ) s s 4 4 Pokud: ε > 0, pak je rozděleí četostí kladě zašpčatělé (špčaté) ε = 0, pak je rozděleí četostí ormálě zašpčatělé ε < 0, pak je rozděleí četostí záporě zašpčatělé (ploché) Pro zájemce Obr. Rozložeí četostí ve statstckém souboru - ukázky špčatost: a) ε < 0, b) ε = 0, c) ε > 0 (Prame: autor). Pokusíme se vysvětlt s termí stupě volost, což je termí velm často používaý v případě, že přecházíme v úvahách od výběrového souboru a soubor základí, většou bezrozměrý. Je-l k dspozc pouze jeda aměřeá ebo jak zjštěá hodota, tedy výběrový soubor o rozsahu =, takovýto výběr ám poskytuje formac o průměru základího souboru. Ale emáme žádou možost dozvědět se cokolv o charakterstce varablty výběru (odkud kam jsou hodoty uspořádáy, jak jsou rozmístěy ), o varabltě zkrátka emůžeme usuzovat z jedé jedé hodoty. Uvažovat ěco o rozptýleost dat můžeme od většího ež. Pro výpočet varablty výběru a ásledě její odhad pro základí soubor tak musíme utě mít k dspozc - jedotek. Čle tedy považujeme za správého děltele pro výpočet rozptylu a směrodaté odchylky, který slouží k odhadům parametrů základího souboru. Příklady s ukážeme v ásledující kaptole. Příklad / Příklad z prae Máte k dspozc tervalové rozděleí četostí (vz íže). Spočítejte charakterstky polohy průměr, modus, určete terval, kde leží medá; varablty rozptyl, směrodatou odchylku, varačí koefcet; koefcet škmost a špčatost. terval č. s terval č. s 0,5 0 0,5 4,5,5 3 3,5 3,5 36 4 3,5 3 4 3,5 4 5 4,5 4 5 4,5 48 6 5,5 5 6 5,5 35 7 6,5 6 7 6,5 7 8 7,5 8 8 7,5 5 9 8,5 0 9 8,5 4 0 9,5 8 0 9,5

7 Úkol / Úkol k zamyšleí Jak se změí vzorce pro výpočty charakterstk polohy, varablty, škmost a špčatost z tervalového rozděleí četostí, ebude-l ve výpočtu fgurovat absolutí četost, ale relatví četost? SHRNUTÍ Výpočty číselých charakterstk příslušých statstckým souborům také patří k elemetárím dovedostem ezbytým pro schopost porováváí souborů mez sebou a vyvozováí prmárích formací o sledovaém geografckém jevu. Jsme díky m schop ajít typckou hodotu jevu, kterou ejčastěj ztotožňujeme s průměrem, modem ebo medáem, umíme posoudt, jak jsou data v souborech rozprostřea, jestl více č méě osclují od středí hodoty, je-l rozděleí četostí symetrcké, ploché ebo špčaté. Tyto prvky popsé statstky představují základ pro pravděpodobostí statstku, která a tu popsou bezprostředě avazuje. Kotrolí otázky a úkoly. Vysvětl rozdíl mez typckým a etypckým artmetckým průměrem.. Která z charakterstk varablty je ejpoužívaější a proč? Přblž její výpočet. 3. Vysvětl, jaký je rozdíl mez artmetckým průměrem vypočítaým z etříděých dat a mez průměrem vypočítaým z tervalového rozděleí četostí (tj. ezáme všechy vstupí hodoty, pouze tervaly a jm příslušé četost). Pojmy k zapamatováí Pojem : průměr, modus, medá, kvatly Pojem : směrodatá odchylka, průměrá odchylka, rozptyl Pojem 3: varačí koefcet, škmost, špčatost

8 4 Teore rozděleí Cíl Po prostudováí této kaptoly budete umět: vysvětlt prcp přechodu studa od výběrového souboru k základímu, objast rozdíly mez spojtou, espojtou áhodou velčou a jejím rozděleím, posoudt etremtu geografckých jevů. Doba potřebá k prostudováí kaptoly: 0 mut. Průvodce studem Z předcházející kaptoly umíme statstckým souborům vypočítat a přřadt jejch číselé charakterstky, a jejchž základě je můžeme vzájemě srovávat. To jsou ezbyté dovedost pro úspěšé zvládutí kaptoly ásledující. Jejím cílem bude čteář přblížt a objast přechod od studa výběrových souborů, resp. souborů s koečým rozsahem směrem k zobecěí, k úvahám, jak se chová soubor základí, bezrozměrý. Dostáváme se tak od popsé statstky ke statstce pravděpodobostí, která má také za úkol přřazovat hodotám geografckých jevů pravděpodobost, se kterým mohou astat, ebo je klasfkovat z hledska etremty, tz. detfkovat, je-l údaj ormálí, podormálí apod. Studum s rozdělíme a dvě část, zvlášť se podíváme a áhodé velčy espojté, z jého pohledu a ty spojté. Bude ás zajímat tvar tzv. pravděpodobostí křvky, která ám apoví o četostech a jejch rozložeí (rozděleí) v bezrozměrém statstckém souboru. Taková rozděleí azveme teoretcká rozděleí áhodé velčy a uvedeme s jejch základí příklady v závslost a jejch tvaru a dalších parametrech. 4. Náhodá velča Za áhodou velču (v obecé rově, kolv jeom v geograf) považujeme proměou, pro kterou elze a základě určté zákotost předem staovt její kokrétí hodotu. Pokud tato proměá může abývat jakékolv hodoty (v určtém tervalu), azveme j spojtou áhodou velčou, v opačém případě hovoříme o velčě espojté ebol dskrétí. Příklady áhodých velč geograf: Spojté: teplota, vlhkost a tlak vzduchu; srážkové úhry; průtoky; hrubé míry porodost, úmrtost apod.; de stáří; průměrý věk; míra ezaměstaost; dokočeé byty a 000 obyvatel; atd. Nespojté: ejrůzější četost, apř. četost srážkových období; četost věkových kategorí; počet suchých měsíců v roce; arozeí chlapce ebo dívky; apod. 4. Teoretcké rozděleí áhodé velčy Ve statstce pracujeme často s výběrovým soubory o rozsahu, jejchž grafckým zázorěím je hstogram. Budeme-l zvětšovat rozsah souboru (př předpokladu, že áhodá

9 velča je spojtá) a hodoty třídt do stále meších tervalů, dostaeme hstogramy, které se budou stále více blížt hladké křvce (vz obr. ). Této hladké křvky dosáheme v teoretckém lmtím případě, kdy soubor o ekoečě velkém rozsahu třídíme do ekoečě moha ekoečě úzkých tervalů. Dostaeme tak frekvečí (též pravděpodobostí) fukc f() ebol hustotu pravděpodobost. Aalogcky bychom mohl přejít od součtové čáry ke spojté křvce F() k tzv. dstrbučí ebo součtové fukc. Frekvečí fukce tak představuje teoretcké rozděleí četostí základího souboru o parametrech: středí hodota směrodatá odchylka Lmtí přechod spočívá v eustálém tříděí stále většího počtu hodot do zvětšujícího se počtu zužujících se tervalů. Obr. Kostrukce frekvečí fukce tzv. lmtím přechodem. (Prame: autor). 4.. Normálí (Gaussovo) rozděleí Patří mez ejčastěj používaá rozděleí spojté áhodé velčy. Bylo pozorováo př opakovaém měřeí téže velčy za stálých podmíek, kdy se jedotlvé hodoty více č méě odlšovaly od průměré hodoty. Normálí rozděleí příslušé středí hodotě μ a směrodaté odchylce σ je zpravdla ozačováo N( μ, σ ). Frekvečí fukce ormálího rozděleí má tvar ( μ ) σ f ( ) = e, σ π fukce dstrbučí pak ( μ ) σ ( e F ) = σ π d.

30 Obr. 3 Ukázky Gaussových křvek příslušých ormálím rozděleím. (Prame: autor). Obr. 4 Ukázky dstrbučích fukcí ormálích rozděleí. (Prame: autor). Normovaé ormálí rozděleí Jstou evýhodou ormálího rozděleí je jeho závslost a dvou parametrech ( μ, ), proto ho v pra často ormujeme pomocí substtučího výrazu z = μ. σ Po jeho aplkac dostaeme frekvečí a dstrbučí fukc ve tvaru: σ f ( z) = e π z z F( z) = e dz π z Takto upraveé ormovaé ormálí rozděleí jž ezávsí a parametrech, a má ásledující vlastost: zvoovtý tvar, asymptotcky se přblžuje ose, souměrá podle osy, která prochází vrcholem, -ová souřadce vrcholu je artmetckým průměrem ormálího rozděleí, artmetcký průměr se rová modu a medáu,

3 ormálí křvka omezuje plochu 00 % (ebo ), lze tak určt pravděpodobost, s mž leží hodoty v určtém tervalu (vz obr. 5): o v tervalu μ ±σ leží 68,8 % všech hodot o v tervalu μ ± σ leží 95,45 % všech hodot o v tervalu μ ± 3σ leží 99,73 % všech hodot ebo z opačého pohledu o 95 % hodot odpovídá tervalu μ ±,65σ o 99 % hodot odpovídá tervalu μ ±,58σ Obr. 5 rozložeí hodot pod křvkou ormálích rozděleí. (Prame: autor). V geograf se často setkáváme s rozděleím jevů podle etremty. Tato typologe, která vychází z aplkace ormálího rozděleí je uvedea v ásledující tabulce 3: Tab. 3 Normálí rozděleí a etremta jevů. sloví ozačeí etremty meze pravděpodobost výskytu jevu (%) etrémě podormálí do μ 3σ 0,35 slě podormálí μ 3 až σ,90 podormálí μ až σ 3,590 ormálí μ až +σ 68,70 adormálí μ + až +σ 3,590 slě adormálí μ + až +3σ,90 etrémě adormálí μ +3σ a více 0,35 Prame: Autor.

3 Pro zájemce Sestrojt grafy frekvečích a dstrbučích fukcí ormálího rozděleí v softwarovém rozhraí tabulkového procesoru Ecel je poměrě sadé. Stačí využít fukce ormdst a vhodě zadat parametry pro jaká hledáme hodotu frekvečí resp. dstrbučí fukce; středí hodotu; směrodatou odchylku a požadavku a frekvečí ( epravda ) ebo dstrbučí fukc ( pravda ). Hodoty, které dostaeme, pak sado vyeseme do bodového grafu. Ne všechy geografcké jevy se ale řídí ormálím rozděleím. Data, která máme k dspozc, musíme buď trasformovat (vhodou trasformací, apř. logartmckou) ebo využít ěkterá z dalších teoretckých rozděleí spojté áhodé velčy. Nejčastějším příklady jsou rozděleí: Fsherovo (též F-rozděleí), Studetovo (t-rozděleí), ebo rozděleí χ² ( chí kvadrát ). Jejch kostrukce a vlastost vychází ze stejých prcpů, které jsme ukázal u ormálího rozděleí. Příklad / Příklad z prae Víme-l, že se studovaá velča řídí určtým rozděleím, máme v ruce slý ástroj k tomu, abychom mohl určt s jakou pravděpodobostí bude její určtá mez překročea, kolk hodot z uskutečěých měřeí pade do určtého tervalu atd. Jestlže má velča N ormovaé ormálí rozděleí tj. N(0,) určete: a) pravděpodobost, že N >,64 b) pravděpodobost, že N <,64 c) pravděpodobost, že,0 < N <,5 d) pravděpodobost, že < N < Doporučeí: Pracujte s dstrbučí fukcí ormálího rozděleí, ebo v Ecelu vhodě využjte fukc NORMDIST. Výsledky: a) 5, %; b) 5, %; c) 9, %; d) 95,4 %. Úkol / Úkol k zamyšleí Čas potřebý a vypracováí testu a VŠ má ormálí rozděleí s průměrou dobou 05 mut a směrodatou odchylkou 0 mut. a) kolk procet studetů dokočí test do dvou hod? b) kolk času by mělo být dáo, aby test mohlo dokočt 95 % studetů? 4.. Bomcké rozděleí Průvodce studem Podívejme se a problematku espojté áhodé velčy ejdříve egeografckým způsobem. Basketbalsta v tréku pravdelě proměí z 0 sedmmetrových hodů 7. Zajímá ás, kolk jch proměí s ejvětší pravděpodobostí v zápase, hází-l sedmmetrových hodů 0. S jakou pravděpodobostí proměí více ež 5 hodů? S jakou pravděpodobostí proměí přesě 5 hodů z 0? To je typcký příklad a bomcké rozděleí. Proč? Estují pouze dvě varaty výsledku pokusu, který je v tomto případě hod a koš. Buď hráč proměí, ebo kolv. V ašem případě proměňuje v koš 7 hodů z 0, tz. pravděpodobost úspěchu (p) je 7/0, tj. 0,7 (ebo též 70 %). Pravděpodobost eúspěchu (q) je logcky 0,7 = 0,3. Jak vypadá frekvečí a dstrbučí fukce tohoto rozděleí? Jaké jsou odpověd a aše otázky? Dozvíme se v ásledující podkaptole.

33 Na rozdíl od ormálího rozděleí je bomcké rozděleí ejtypčtějším rozděleím dskrétí áhodé velčy. Udává rozděleí výsledků př opakováí jedoho a téhož pokusu za stejých podmíek, přčemž výsledkem pokusu mohou být pouze alteratvy: A, ebo B. Pravděpodobost, že astae alteratva A ozačíme jako p, pravděpodobost, že astae alteratva B, ozačíme jako q, přtom musí platt, že p + q =. Za předpokladu, že provedeme uvažovaý pokus -krát, hledáme pravděpodobost, že alteratva A (s pravděpodobostí p) astae právě -krát. Výpočet pravděpodobost provádíme pomocí ásledující rovce, která vlastě udává obecý čle bomckého rozvoje a vyjadřuje rozděleí pravděpodobostí bomckého rozděleí: f = p q q ( ).! = p!( )! Obr. 6 Ukázky frekvečích fukcí bomckého rozděleí pro = 8 a postupě p = 0,5; 0,5 a 0,75. (Prame: autor). Obr. 7 Ukázky dstrbučích fukcí bomckého rozděleí pro = 8 a postupě p = 0,5; 0,5 a 0,75. (Prame: autor). Pro zájemce Modelovat grafy frekvečích a dstrbučích fukcí bomckého rozděleí lze velm jedoduše v softwarovém rozhraí tabulkového procesoru Ecel, a to s využtím fukce BINOMDIST (bomal dstrbuto) a vhodě zadaých parametrů pravděpodobost úspěchu (p), počet pokusů a požadavku a frekvečí ( epravda ) ebo dstrbučí fukc ( pravda ). Příklad / Příklad z prae Zodpovězeí otázek z průvodce studem a str. 3: Pravděpodobost p = 0,7, počet pokusů = 0. Frekvečí a dstrbučí fukce tohoto bomckého rozděleí vz obr. 8 a 9. Pravděpodobost proměěí právě 5 hodů je hodota frekvečí fukce pro = 5, tj. 0,79 (7,9 %). Pravděpodobost, se kterou hráč proměí méě ež 5 hodů je hodotou dstrbučí fukce pro = 4, tj. 0,584 (58,4 %). Pravděpodobost, se kterou proměí

34 více ež 5 hodů je (mus) hodota dstrbučí fukce pro = 5 (proměěí 5 ebo méě hodů), tj. 0,76 = 0,38 (3,8 %). 0,5 0,0 0,5 0,0 0,05 0,00 0 3 4 5 6 7 8 9 0 3 4 5 6 7 8 9 0 Obr. 8 Frekvečí fukce bomckého rozděleí pro = 0 a p = 0,7. (Prame: autor).,0,00 0,80 0,60 0,40 0,0 0,00 0 3 4 5 6 7 8 9 0 3 4 5 6 7 8 9 0 Obr. 9 Dstrbučí fukce bomckého rozděleí pro = 0 a p = 0,7. (Prame: autor). Teore bomckého rozděleí se v geograf často využívá, apř. př staovováí pravděpodobostí roků s určtým počtem suchých měsíců apod. Dalším z příkladů teoretckého rozděleí espojté áhodé velčy je apříklad rozděleí Possoovo. Úkol / Úkol k zamyšleí Pokuste se vymyslet vhodé uplatěí bomckého rozděleí a geografcké jevy. SHRNUTÍ Kaptola teoretcká rozděleí představuje stručý vstup do problematky pravděpodobostí statstky. Nejdůležtějším pozatkem je tzv. lmtí přechod, kdy se sažíme sestrojt hladkou křvku teoretckého rozděleí, tzv. hustotu pravděpodobost (resp. frekvečí fukc). Podstatou je saha objast chováí základího souboru, vycházíme přtom ze