1 EXPLORATORNÍ ANALÝZA PROMNNÝCH. as ke studiu kapitoly: 120 minut. Cíl: Po prostudování této kapitoly budete umt použít



Podobné dokumenty
4.2 Elementární statistické zpracování Rozdělení četností

Mendelova univerzita v Brně Statistika projekt

1 EXPLORATORNÍ ANALÝZA PROMĚNNÝCH. Čas ke studiu kapitoly: 120 minut. Cíl: Po prostudování této kapitoly budete umět použít

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

2 EXPLORATORNÍ ANALÝZA

Doc. Ing. Dagmar Blatná, CSc.

Výsledky této ásti regresní analýzy jsou asto na výstupu z poítae prezentovány ve form tabulky analýzy rozptylu.

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

11. Popisná statistika

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

Úvod do korelační a regresní analýzy

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

ZÁKLADY PRAVDĚPODOBNOSTI A STATISTIKY

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Metodika: Goniometrický tvar komplexního ísla, binomická rovnice

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Pro orientaci v této problematice jsme se seznámili s nkolika novými pojmy:

SOUKROMÁ VYSOKÁ ŠKOLA EKONOMICKÁ ZNOJMO. Statistika I. distanční studijní opora. Milan Křápek

BIVŠ. Pravděpodobnost a statistika

Spolehlivost a diagnostika

S1P Popisná statistika. Popisná statistika. Libor Žák

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

[ jednotky ] Chyby měření

LABORATORNÍ CVIČENÍ Z FYZIKY. Měření objemu tuhých těles přímou metodou

a další charakteristikou je četnost výběrového souboru n.

Testování statistických hypotéz

Náhodné jevy, jevové pole, pravděpodobnost

ODRAZ A LOM SVTLA. Odraz svtla lom svtla index lomu úplný odraz svtla píklady

a) Hypotézy o parametru jedné populace (o stední hodnot, mediánu, rozptylu, relativní

9.3.5 Korelace. Předpoklady: 9304

Metody zkoumání závislosti numerických proměnných

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

P1: Úvod do experimentálních metod

1. Základy měření neelektrických veličin

Deskriptivní statistika 1

11. Časové řady Pojem a klasifikace časových řad

Statistika - vícerozměrné metody

Generování dvojrozměrných rozdělení pomocí copulí

STATISTICKÁ ANALÝZA. Doc. RNDr. Zden k Karpíšek, CSc. P ehledový u ební text pro doktorské studium. Vysoké u ení technické v Brn

Střední hodnoty. Aritmetický průměr prostý Aleš Drobník strana 1

Úvod do teorie měření

APLIKOVANÁ STATISTIKA

U. Jestliže lineární zobrazení Df x n n

Výukový modul III.2 Inovace a zkvalitnění výuky prostřednictvím ICT

Odhady parametrů 1. Odhady parametrů

je hustota pravdpodobnosti nebo pravdpodobnostní funkce náhodného výbru X (X 1, X 2,, X n ). , jako odhad. Nech f ( x;θ)

, jsou naměřené a vypočtené hodnoty závisle

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

12. Neparametrické hypotézy

PRAVDĚPODOBNOST A STATISTIKA

9. Měření závislostí ve statistice Pevná a volná závislost

Chyby přímých měření. Úvod

13 Popisná statistika

VY_52_INOVACE_J 05 01

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

9. Základní statistické pojmy.

POPISNÁ STATISTIKA. Předmět popisné statistiky

6. Posloupnosti a jejich limity, řady

12. N á h o d n ý v ý b ě r

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

1.3. ORTOGONÁLNÍ A ORTONORMÁLNÍ BÁZE

Časová hodnota peněz. Metody vyhodnocení efektivnosti investic. Příklad

IV. NEJISTOTY MENÍ A ZPRACOVÁNÍ VÝSLEDK

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

8.2.1 Aritmetická posloupnost I

8. Zákony velkých čísel

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

8.2.1 Aritmetická posloupnost

9 NÁHODNÉ VÝBĚRY A JEJICH ZPRACOVÁNÍ. Čas ke studiu kapitoly: 30 minut. Cíl:

Přednáška č. 2 náhodné veličiny

NEPARAMETRICKÉ METODY

7 LIMITNÍ VĚTY. Čas ke studiu kapitoly: 70 minut. Cíl:

STATISTICKÉ MINIMUM PRO STUDENTY BAKALÁŘSKÉHO STUDIA NA TECHNICKÝCH OBORECH BOHUMIL MINAŘÍK

1.1 Definice a základní pojmy

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

Domácí práce z p edm tu D01M6F Statistika

Univerzita Karlova v Praze Pedagogická fakulta

Statistické charakteristiky (míry)

Úvod do zpracování měření

Základy statistiky. Petr Kladivo

PRAVDĚPODOBNOST A STATISTIKA

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

Téma 6: Indexy a diference

3. Lineární diferenciální rovnice úvod do teorie

Soustava momentů. k s. Je-li tedy ve vzorci obecného momentu s = 1, získáme vzorec aritmetického průměru.

P2: Statistické zpracování dat

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

7.Vybrané aplikace optimalizačních modelů

PRAVDĚPODOBNOST A STATISTIKA

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Fakulta elektrotechniky a informatiky Statistika STATISTIKA

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy

Úvod do lineárního programování

Transkript:

EXPLORATORNÍ ANALÝZA PROMNNÝCH as ke studu kaptoly: mut Cíl: Po prostudováí této kaptoly budete umt použít základí pojmy eploratorí (popsé) statstky typy datových promých statstcké charakterstky a grafckou demostrac kvaltatvích promých statstcké charakterstky a grafckou demostrac kvattatvích promých - -

Výklad: Pvodím posláím statstky bylo zjšováí údaj o populac a základ výbrového souboru. Pod pojmem populace ptom rozumjte souhr všech estujících prvk, které sledujeme p statstckém výzkumu. Napíklad:. Provádíme-l stat. výzkum týkající se výšky 5-t letých dívek, populac tvoí všechy dívky, které mají práv 5 let.. Zkoumáme-l pevost la L5 vyrobeých frmou LANOS, budeme za populac považovat všecha laa L5 vyrobea frmou LANOS Vzhledem k tomu, že rozsah (poet prvk) populace je obvykle vysoký, provádí se vtšou tzv. výbrová šeteí, kdy se amísto celé populace zkoumá pouze její ást. Zkoumaá ást populace se azývá výbr, pop. výbrový soubor. Otázkou je jak staovt takový výbr, aby byl skute reprezetatví, tj. aby parametry výbru (ap. prmr) dostate pes reprezetovaly parametry populace. Je s zkuste pedstavt k jakým výsledkm bychom došl p pedvolebím przkumu provádém a vzorku vol, který bychom získal v domovech dchodc, pop. a schzích mladých kozervatvc. Estuje kolk zpsobu jak výbr provést. Abychom se vyvaroval opomeutí kterých prvk populace, zvolíme tzv. áhodý výbr, v mž každý prvek populace má stejou šac být zaaze do výbru. Je zejmé, že výbrové šeteí emže být kdy tak pesé jako przkum celé populace. Pro jej tedy preferujeme?. Úspora asu a faích prostedk (zejméa u rozsáhlé populace). Destruktví testováí (které testy pevost la, žvotost závek, obsah cholesterolu v krv, atd. vedou k destrukc zkoumaých prvk; zamyslete se sam k emu by vedlo testováí celé populace) 3. Nedostupost celé populace (p srováváí psobeí faktor okolí a ddých zak poskytují ejlepší formace detcká dvojata jak je všecha sehat a pesvdt ke spoluprác?) Nyí tedy víte, že statstkové dokáž popsat celou populac a základ pozatk z výbru, proto pejdeme k základím výbrovým šeteím ebol k eploratorí aalýze (eploratory data aalyss EDA). Údajm, které u souboru sledujeme budeme íkat promé a jejch jedotlvým hodotám varaty promé. Eploratorí (popsá) statstka bývá prvím krokem k odhaleí formací skrytých ve velkém možství promých a jejch varat. To zameá uspoádáí promých do ázorjší formy a jejch pops kolka málo hodotam, které by obsahovaly co ejvtší možství formací obsažeých v pvodím souboru. Vzhledem k tomu, že zpsob zpracováí promých závsí pedevším a jejch typu, sezámíme se yí se základím dleím promých do rzých kategorí. Toto dleí je prezetováo a ásledujícím obrázku: - -

Promá Kvaltatví (kategorálí, sloví...) Kvattatví (umercké, íselé...) základí dleí Dskrétí Spojtá Nomálí Ordálí Koeá Spoetá dleí podle potu varat Alteratví Možé Promá kvaltatví její varaty jsou vyjádey slov a podle vztahu mez jedotlvým hodotam se dlí a dv základí podskupy: Promá omálí (jmeá) abývá rovoceých varat; elze je porovávat a seadt (ap. pohlaví, árodost, zaka hodek...) Promá ordálí tvoí pechod mez kvaltatvím a kvattatvím promým; jedotlvým varatám lze padt poadí a vzájem je porovávat ebo seadt (ap. zámka ve škole, velkost odv (S, M, L, XL)) Jým zpsobem dleí kvaltatvích promých je dleí podle potu varat, jchž promé mohou abývat: Promá alteratví abývá pouze dvou rzých varat (ap. pohlaví...) Promá možá abývá více ež dvou rzých varat (ap. vzdláí, jméo, barva oí...) Promá kvattatví je vyjádea ísel a dlí se a: Promá dskrétí abývá koeého ebo spoetého možství varat (ap. zámka z matematky) - 3 -

- Promá dskrétí koeá abývá koeého potu varat (ap. zámka z matematky) - Promá dskrétí spoetá abývá spoetého možství varat (ap. vk v letech, výška v cetmetrech, váha v klogramech...) Promá spojtá - abývá lbovolé hodoty z R ebo z jaké podmožy R (ap. výška, hmotost, vzdáleost mst...) Prvodce studem: Tak, defce máme za sebou, proto mžeme pejít k vcem prakttjším. Pedstavte s stuac, že máte k dspozc statstcký soubor o pomr velkém rozsahu a stojíte ped otázkou co s ím, jak jej co ejvýstžj popsat a zázort. íselé hodoty, kterým takovýto rozsáhlý soubor ahradíme, posthují základí vlastost tohoto souboru a my jm budeme íkat statstcké charakterstky (statstky). V ásledujících kaptolách se dozvíte jak urt statstcké charakterstky pro rzé typy promých a jak rozsáhlejší statstcké soubory zázort. A jdeme a to! Výklad:. Statstcké charakterstky kvaltatvích promých V tuto chvíl jž víte, že kvaltatví (sloví) promá má dva základí typy omálí a ordálí... Nomálí promá Nomálí promá abývá v rámc souboru rzých avšak rovoceých varat. Poet tchto varat ebývá pílš vysoký, a proto prví statstckou charakterstkou, kterou k jejímu popsu použjeme je etost. etost (absolutí etost, frequecy) je defováa jako poet výskytu daé varaty kvaltatví promé. V pípad, že kvaltatví promá ve statstckém souboru o rozsahu hodot abývá k rzých varat, jejchž etost ozaíme,,, k, musí zejm platt: + +... + k k - 4 -

Chceme-l vyjádt jakou ást souboru tvoí promé s daou varatou, použjeme pro pops promé relatví etost. Relatví etost p (relatve frequecy) je defováa jako: p, pop. p [%] (Druhý vzorec použjeme v pípad, chceme-l relatví etost vyjádt v procetech.) Pro relatví etost musí platt: k + p + + p k p p P zpracováí kvaltatví promé je vhodé etost relatví etost uspoádat do tzv. tabulky rozdleí etost (frequecy table): Hodoty TABULKA ROZDLENÍ ETNOSTI Absolutí etost Relatví etost p p p k Celkem k k k p k p Posledí charakterstkou, kterou s pro pops omálí promé uvedeme je modus. Modus defujeme jako ázev varaty promé vykazující ejvyšší etost. Modus tedy mžeme chápat jako typckého reprezetata souboru. V pípad, že se ve statstckém souboru vyskytuje více varat s mamálí etost, modus eurujeme... Grafcké zázorí kvaltatví promé Pro vtší ázorost aalýzy promých se ve statstce asto užívají grafy. Pro omálí promou jsou to tyto dva typy: Hstogram (sloupcový graf, bar chart) Výseový graf (koláový graf, pe chart) - 5 -

Hstogram je klasckým grafem, v mž a jedu osu vyášíme varaty promé a a druhou osu jejch etost. Jedotlvé hodoty etost jsou pak zobrazey jako sloupce (obdélíky, pop. úseky, hraoly, kužely...) 5 5 5 Výborý Chvaltebý Dobrý Dostateý 8 6 4 8 6 4 Výborý Chvaltebý Dobrý Dostateý 8 6 4 8 6 4 Výborý Chvaltebý Dobrý Dostateý 8 6 4 8 6 4 Výborý Chvaltebý Dobrý Dostateý 8 6 4 8 6 4 Dostateý Dobrý Chvaltebý Výborý Výborý Chvaltebý Dobrý Dostateý 5 5 5 Výseový graf prezetuje relatví etost jedotlvých varat promé, pemž jedotlvé relatví etost jsou úmr reprezetováy plocham píslušých kruhových výseí. (Zmou kruhu a elpsu dojde k trojrozmrému efektu.) 8 5 8 5 Výborý Chvaltebý Výborý Chvaltebý Dobrý Dobrý Dostateý Dostateý 8 5 8 5 Výborý Chvaltebý Výborý Chvaltebý Dobrý Dobrý Dostateý Dostateý - 6 -

POZOR!!! V pípad výseového grafu s dejte zvláští pozor a pops grafu. Jedotlvé výsee estaí ozat relatvím etostm bez uvedeí etost absolutích, pop. bez uvedeí celkového potu pozorováí, to by mohlo vést k mateí (a už zámrému ebo echtému) toho, jemuž je graf ure. Zamyslete se ad ásledující ukázkou. Píklad k zamyšleí: Mulý týde jsme zpracoval aketu týkající se ázoru a zavedeí školého a vysokých školách. Výsledky prezetuje ásledující graf: PROTI 5% PRO 5% Co vy a to? Zajímavé výsledky, že? A vte, evte pravdvé. A te graf doplíme tak, jak jsme Vám to doporul: PRO PROTI Co s myslíte yí? Z druhého grafu je patré, že byl dotazováí dva ldé jede byl pro a jede prot. Jaká je vypovídací schopost takovéto akety? Jaký je yí Váš ázor a prezetovaé výsledky? A závr? Vy vytváejte pouze takové grafy, jejchž terpretace je zcela jasá a je-l Vám výseový graf bez uvedeí absolutích etostí pedkládá, ptejte se vždy, zda je dvod v ezalost autora zda je to jeho zámr. Prvodce studem: Te pšel as a oveí toho, zda jste porozuml pedcházejícímu výkladu. Následující píklad se pokuste vyešt samostat, ukázkové ešeí použjte ke kotrole svého postupu. - 7 -

ešeý píklad: Níže uvedeá data pedstavují ásteý výsledek zazameaý p przkumu zatížeí jedé z ostravských kžovatek, a to barvu projíždjících automobl. Data vyhodote a grafcky zázorte. ešeí: erveá modrá erveá zeleá modrá erveá erveá bílá zeleá zeleá modrá erveá Je zejmé, že se jedá o kvaltatví (sloví) promou a vzhledem k tomu, že barvy automobl emá smysl seazovat a porovávat, mžeme kostatovat, že se jedá o promou omálí. Pro její pops tedy zvolíme tabulku etostí, uríme modus a barvu projíždjících automobl zázoríme prostedctvím hstogramu a výseového grafu. TABULKA ROZDLENÍ ETNOSTI Barvy Absolutí etost Relatví etost projíždjících automobl p erveá 5 5, 4 modrá 3 3, 5 bílá, 8 zeleá 3 3, 5 Celkem, Modus erveá (tj. v zazameaém vzorku se vyskytlo ejvíce erveých automobl) Barvy projíždjících automobl Barvy projíždjících automobl 6 Poet automobl 5 4 3 zeleá 5% bílá 8% erveá 4% erveá modrá bílá zeleá Barv y modrá 5% Celkem bylo sledováo automobl - 8 -

Výklad:..3 Ordálí promá Dále budeme pokraovat popsem ordálí promé. Ordálí promá, stej jako omálí, abývá v rámc souboru rzých slovích varat, avšak tyto varaty jsou seadtelé, tj. mžeme urt, která je meší a která je vtší. Pro pops ordálí promé se používají stejé statstcké charakterstky a grafy jako pro pops omálí promé (etost, relatví etost, modus + hstogram, výseový graf) rozšíeé o další dv charakterstky (kumulatví etost, kumulatví relatví etost) posthující uspoádáí ordálí promé. Kumulatví etost m defujeme jako poet hodot promé, které abývají varaty žší ebo rové -té varat. Uvažte ap. promou zámka ze statstky, která abývá varat: výborý, velm dobrý, dobrý, eprospl, pak ap. kumulatví etost pro varatu dobrý bude rova potu studet, kteí ze statstky získal zámku dobrý ebo lepší. Jsou-l jedotlvé varaty uspoádáy podle své velkost ( < < < ), platí: k m j j Je tedy zejmé, že kumulatví etost k-té ( ejvyšší ) varaty je rova rozsahu promé. m k Druhou specálí charakterstkou ureou pouze pro ordálí promou je kumulatví relatví etost. Kumulatví relatví etost F vyjaduje jakou ást souboru tvoí hodoty abývající -té a žší varaty. F p j j což eí c jého ež relatví vyjádeí kumulatví etost: F m - 9 -

Obdob jako u omálí promé, mžeme u ordálí promé prezetovat statstcké charakterstky pomocí tabulky rozdleí etost. Ta obsahuje ve srováí s tabulkou rozdleí etostí pro omálí promou avíc hodoty kumulatvích a kumulatvích relatvích etostí. Hodoty Absolutí etost TABULKA ROZDLENÍ ETNOSTI Kumulatví etost Relatví etost Relatví kumulatví etost m p F m m + m + p p F p F p + p F + p k Celkem k k m + k p k k F F + p k k k k ----- ----- p k..4 Grafcké zázorí ordálí promé Co se týe grafcké prezetace ordálí promé, zmíl jsme jž hstogram a výseový graf. A jede z tchto graf však ezazameává uspoádáí jedotlvých varat. K tomu ám slouží polygo kumulatvích (resp. kumulatvích relatvích) etostí, pop. Paretv graf. Polygo kumulatvích etostí (Galtoova ogva, S kvka) je spojcovým grafem, v mž se a vodorovou osu vyáší jedotlvé varaty promé v poadí od ejmeší do ejvtší a a svslou osu píslušé hodoty kumulatvích etostí. Všmte s, smrce (sklo) polygou kumulatvích etostí je tím žší, ím žší je etost jedotlvých varat. Kumulatví etost 4 8 6 4 Galtoova ogva zámek ze statstky Výborý Chvaltebý Dobrý Dostateý Zámky - 3 -

Paretv graf je v techckých dscplíách asto užívaým grafem tvoeým spojeím hstogramu a polygou kumulatvích etostí, v mž se a vodorovou osu vyáší jedotlvé varaty promé v poadí od té s ejvtším po tu s ejmeším výzamem. 4 3 N 37 5 Prvodce studem: A zovu s mžete ovt, zda dokážete správ aplkovat abyté vdomost. ešeý píklad: Následující data pedstavují velkost trek prodaých p výprodej frmy TRIKO. S, M, L, S, M, L, XL, XL, M, XL, XL, L, M, S, M, L, L, XL, XL, XL, L, M a) Data vyhodote a grafcky zázorte. b) Urete kolk procet ldí s kouplo trko velkost ejvýše L. ešeí: ada) Zejm se jedá o kvaltatví (sloví) promou a vzhledem k tomu, že velkost trek lze seadt, jde o promou ordálí. Pro její pops proto použjeme tabulku etostí pro ordálí promou, v íž varaty velkost trek budou seazey od ejmeší po ejvtší (S, M. L, XL) a modus. - 3 -

Velkost trek TABULKA ROZDLENÍ ETNOSTI Absolutí etost Kumulatví etost Relatví etost Relatví kumulatví etost m p F S 3 3 3, 4 3, 4 M 6 3 + 6 9 6, 7 9, 4 L 6 9 + 6 5 6, 7 5, 68 XL 7 5 + 7 7, 3, Celkem -----, ----- Modus XL (ejvíce ldí s kouplo trko velkost XL) Grafcký výstup bude tvot hstogram, výseový graf a polygo kumulatvích etostí (jelkož se ejedá o techcká data, Paretv graf vytváet ebudeme). Grafcký výstup: Poty prodaých trek Prodaá trka 8 6 4 XL 3% S 4% S M L XL V elkost t rek L 7% M 7% Hstogram Celkem bylo prodáo trek Výseo Polygo kumulatvích etostí prodaých trk 5 5 5 S M L XL V elkost t rk Galtoova ogva, S-kvka adb) Na tuto otázku ám dá odpov relatví kumulatví etost pro varatu L, která uruje jaká ást prodaých trek byla velkost L a žších. Tj. 68% zákazík s kouplo trko velkost L a meší. - 3 -

Výklad:. Statstcké charakterstky kvattatvích promých Pro pops kvattatví promé mžeme použít vtšu statstckých charakterstk užívaých pro pops promé ordálí (etost, relatví etost, kumulatví etost, kumulatví relatví etost), což doplíme dalším dvm skupam charakterstk: míry polohy ty urují typcké rozložeí hodot promé (jejch rozmístí a íselé ose) a míry varablty urující varabltu (rozptyl) hodot kolem své typcké polohy.. Míry polohy a varablty Sad ejpoužívajším míram polohy jsou prmry promých. Prmry pedstavují prmrou ebo typckou hodotu výbrového souboru. Zejm ejzámjším prmrem pro kvattatví promou je Artmetcký prmr Jeho hodotu získáme pomocí zámého vztahu:! kde:... jedotlvé hodoty promé... rozsah výbrového souboru (poet hodot promé) Pomr zámé jsou vlastost artmetckého prmru:. ( )!, ebol: souet všech odchylek hodot promé od jejch artmetckého prmru je rove ule, což zameá, že artmetcký prmr kompezuje vlv áhodých chyb a promou - 33 -

. ( a R) :! ( a + )! a + ebol: pteme-l ke všem hodotám promé stejé íslo, zvtší se o toto íslo rovž artmetcký prmr 3. ( ) b!! ( b R) : b ebol: vyásobíme-l všechy hodoty promé stejým íslem, zvtší se stejým zpsobem rovž artmetcký prmr Pestože to tak a prví pohled vypadá, artmetcký prmr eí vždy pro výpoet prmru výbrového souboru ejvhodjší. Pracujeme-l, apíklad, s promou pedstavující relatví zmy (rstové dey, ceové dey...), používáme tzv. geometrcký prmr. Pro výpoet prmru v pípadech, kdy promá má charakter ást z celku (úlohy o spoleé prác...), používáme prmr harmocký. Vzhledem k tomu, že prmr se staovuje ze všech hodot promé, ese mamum formací o výbrovém souboru. Na druhé stra je však velm ctlvý a tzv. odlehlá pozorováí, což jsou hodoty, které se mmoád lší od ostatích a dokáží proto vychýlt prmr atolk, že pestává daý výbr reprezetovat. K detfkac odlehlých pozorováí se vrátíme pozdj. Mez míry polohy, které jsou a odlehlých pozorováích mé závslé, patí Modus Pozor! V pípad modu budeme rozlšovat mez dskrétí a spojtou kvattatví promou. Pro dskrétí promou defujeme modus jako hodotu ejetjší varaty promé (podob jako u kvaltatví promé). Naprot tomu u spojté promé považujeme za modus ˆ hodotu kolem íž je ejvtší kocetrace hodot promé. Pro ureí této hodoty využjeme shorth, což je ejkratší terval, v mž leží alespo 5% hodot promé (v pípad výbru o rozsahu k ( k Ν) (sudý poet hodot), leží v shorthu k hodot což je 5% (/) hodot promé, v pípad výbru o rozsahu k + ( k Ν) (lchý poet hodot), leží v shorthu k + hodot - což je o ½ více ež je 5% hodot promé (/+½)). Modus pak defujeme jako sted shorthu. Z pedcházejících defc vyplývá, že délka shorthu (horí mez dolí mez) je jedoza dáa, to však eplatí pro jeho umístí a tudíž a pro modus. Pokud lze modus urt jedoza, mluvíme o umodálí promé, má-l promá dva mody, azýváme j bmodálí. Estece dvou a více modu ve výbru obvykle sgalzuje esourodost (heterogetu) hodot promé. Tuto esourodost bývá možé odstrat rozdleím souboru a podsoubory - roztídím podle - 34 -

kterého jého zaku (ap. bmodálí zak výška lovka lze roztídt podle pohlaví a dva umodálí zaky výška že a výška muž). Prvodce studem: Zdála se Vám pasáž o modu kvattatví promé pílš složtá? Pokusíme se j yí procvt a jedoduchém píkladu, který Vám sad pípadé ejasost ozejmí. ešeý píklad: Následující data pedstavují vk hudebík vystupujících a pehlídce dechových orchestr. Promou vk považujte za spojtou. Urete prmr, shorth a modus vku hudebík. 8 7 43 9 47 4 34 34 4 35 ešeí: a) Ureí prmru: V tomto pípad jedoza použjeme artmetcký prmr (zdvodí sad eí uté):! + 8 + 7 + 43 + 9 + 47 + 4+ 34 + 34 + 4 + 35 38,7 let Prmrý vk hudebíka vystupujícího a pehlídce dechových orchestr je 38,7 let. Prohlédte s ješt jedou zadaá data a promyslete s akolk je prmrý vk reprezetatví statstkou daého výbru (odlehlá pozorováí). b) Ureí shorthu: Náš výbrový soubor má hodot, z ehož vyplývá, že v shorthu bude ležet 6 z ch (rozsah souboru je (lchý poet hodot), 5% z toho je 5,5 (5,5 hodoty se špat uruje, že?) a ejblžší vyšší prozeé íslo je 6 ebol: /+½ / +/ / 6). A další postup? Promou seadíme - 35 -

Uríme délky všech 6-t leých terval, v chž < + < < + 5 Nejkratší z tchto terval prohlásíme za shorth (délka tervalu ) +5 Orgálí data Seazeá data Délky 6-t leých terval 9 6 ( 35 9) 8 9 ( 4 ) 7 7 5 ( 4 7) 43 34 9 ( 43 34) 9 34 3 ( 47 34) 47 35 47 ( 8 35) 4 4 34 4 34 43 4 47 35 8 Z tabulky je zejmé, že ejkratší terval má délku 9, emuž odpovídá jedý terval: 34 ; 43. Shorth 34 ; 43, což mžeme terpretovat ap. tak, že polova hudebík je ve vku 34 až 43 let (jde ptom o ejkratší terval ze všech možých). c) Ureí modu: Modus je defová jako sted shorthu: 34 + 43 ˆ 38,5 Modus 38,5 let, tj. typcký vk hudebíka vystupujícího a pehlídce dechových orchestr je 38,5 let. Výklad: Pro podrobjší vyjádeí rozložeí hodot promé v rámc souboru slouží statstky azývaé kvatly. Kvatly Kvatly jsou statstky, které charakterzují polohu jedotlvých hodot v rámc promé. Podob jako modus, jsou kvatly rezstetí (odolé) v odlehlým pozorováím. Obec je kvatl defová jako hodota, která rozdluje výbrový soubor a dv ást prví z ch obsahuje hodoty, které jsou meší ež daý kvatl; druhá ást obsahuje hodoty, které jsou vtší ebo rovy daému kvatlu. Pro ureí kvatlu je proto uté výbr uspoádat od ejmeší hodoty k ejvtší. Kvatl promé, který oddluje p% meších hodot od zbytku souboru, tj. od (-p)% hodot, azýváme p %-ím kvatlem a zaíme jej p. - 36 -

V pra se ejastj setkáváme s tmto kvatly: Kvartly Dolí kvartl,5 5%-í kvatl (rozdluje datový soubor tak, že 5% hodot je meších ež teto kvartl a zbytek, tj. 75% vtších (ebo rových)) Medá,5 5%-í kvatl (rozdluje datový soubor tak, že polova (5%) hodot je meších ež medá a polova (5%) hodot vtších (ebo rových)) Horí kvartl,75 75%-í kvatl (rozdluje datový soubor tak, že 75% hodot je meších ež teto kvartl a zbytek, tj. 5% vtších (ebo rových)) Kvartly dlí výbrový soubor a 4 stej eté ást. Decly,;,;... ;,9 Decly dlí výbrový soubor a stej etých ást. Percetly, ;, ; ;,99 Percetly dlí výbrový soubor a stej etých ást. Mmum m a Mamum ma m, tj. % hodot je meších ež mmum ma, tj. % hodot je meších ež mamum A yí se dostáváme k tomu, jak se kvatly urují:. Výbrový soubor uspoádáme podle velkost. Jedotlvým hodotám promé padíme poadí, a to tak, že ejmeší hodota bude mít poadí a ejvyšší hodota poadí (rozsah souboru) 3. p%- í kvatl je rove hodot promé s poadím z p, kde: p +,5 z p pemž z p zaokrouhlujeme a celá ísla!!!!! POZOR!!!! V pípad sudého potu dat eí medá defová jedoza, za medá lze považovat kterékolv íslo mez dvm prostedím hodotam, vet tchto hodot, ejastj se však uvádí sted mez obm prostedím hodotam (což esouhlasí s aší defc). Za zmíku zajsté stojí vztah mez kvatly a kumulatví relatví etost. Zejm lze íc, že hodota p udává kumulatví relatví etost kvatlu p, tj. - 37 -

relatví etost tch hodot promé, které jsou meší ež kvatl p. Kvatl a kumulatví relatví etost jsou tedy verzí pojmy. Grafcké ebo tabulkové zázorí setídé promé a píslušých kumulatvích etostí se ozauje jako dstrbuí fukce kumulatví etost, pop. emprcká dstrbuí fukce. Ujasme s yí, jak emprckou dstrbuí fukc pro kvattatví promou urt. Emprcká dstrbuí fukce F() pro kvattatví promou Ozame s p( ) relatví etost hodoty seazeého výbrového souboru ( < < < ). Pro emprckou dstrbuí fukc F() pak platí: F j ( ) p( ) pro j < j+ pro pro <, j F() p( ) p( )... 3 - Emprcká dstrbuí fukce je mootó rostoucí, zleva spojtou fukcí, která skáe podle relatvích etostí píslušých jedotlvým hodotám promé. Zjev tedy platí, že: p ( ) lm F( ) F( ) + Prostedctvím kvatl jsou defováy další dv statstky kvattatví promé terkvartlové rozptí a MAD. Iterkvartlové rozptí IQR Tato statstka je mírou varablty souboru a je defováa jako vzdáleost mez horím a dolím kvartlem: IQR,75,5-38 -

MAD Název MAD je zkratkou aglcké defce meda absolute devato from the meda, l esky: medá absolutích odchylek od medáu Jak jej tedy uríme?. Výbrový soubor uspoádáme podle velkost. Uríme medá souboru 3. Pro každou hodotu souboru uríme absolutí hodotu její odchylky od medáu 4. Absolutí odchylky od medáu uspoádáme podle velkost 5. Uríme medá absolutích odchylek od medáu, tj. MAD Prvodce studem: Moc teore? Abyste se ujstl, že c eí tak eré jak to vypadá, zkuste pokraovat v pedcházejícím ešeém píkladu. ešeý píklad: Pro data z pedcházejícího píkladu urete: a) všechy kvartly, b) terkvartlové rozptí c) MAD d) zakreslete emprckou dstrbuí fukc ešeí: ada) Naším úkolem je urt dolí kvartl,5 ; medá,5 a horí kvartl,75. Budeme-l dodržovat postup doporueý pro urováí kvatl, zameá to data seadt a padt jm poadí. Splí prvích dvou bod postupu ukazuje ásledující tabulka: - 39 -

Seazeá data Poadí Orgálí data 9 8 7 7 3 43 34 4 9 34 5 47 35 6 4 4 7 34 4 8 34 43 9 4 47 35 8 A mžeme pejít k bodu 3, tj. staovt poadí hodot promé pro jedotlvé kvartly a tím jejch hodoty: Dolí kvartl,5 :,5;.,5,5 3,5 3 7, p z p +, 5 tj. 5% hudebík vystupujících a pehlídce dechových orchestr je mladších ež 7 let (75% z ch má 7 let a více). Medá,5 :,5;.,5,5 6 35 p z p +, 5 tj. polova hudebík vystupujících a pehlídce dechových orchestr je mladších ež 35 let (5% z ch má 35 let a více). Horí kvartl,75 :,75;.,75,5 8,75 9 43 p z + p, 75 tj. 75% hudebík vystupujících a pehlídce dechových orchestr je mladších ež 43 let (5% z ch má 43 let a více). adb) Iterkvartlové rozptí IQR: IQR,75,5 43 7 6 adc) MAD Chceme-l urt tuto statstku, budeme postupovat pes podle toho co ám íká defce (medá absolutích odchylek od medáu), tudíž dodržíme výše uvedeý postup, jehož aplkac vám ukazuje ásledující tabulka.,5 35-4 -

MAD M,5 Orgálí data Seazeá data y Absolutí hodoty odchylek seazeých dat od jejch medáu y,5 Seazeé absolutí hodoty odchylek seazeých dat od jejch medáu 9 6 9 35 8 3 35 7 7 8 7 35 43 34 34 35 6 9 34 34 35 7 47 35 35 35 8 4 4 6 4 35 8 34 4 7 4 35 34 43 8 43 35 3 4 47 47 35 6 35 8 47 8 35 47 p,5; z p.,5 +,5 6 M, 5 8 (MAD je medá absolutích odchylek od medáu, tj. 6. hodota seazeého souboru absolutích odchylek od medáu). MAD 8. M add) Zbývá ám posledí úkol sestrojt emprckou dstrbuí fukc. Ppomeme s proto její defc a postupujme podle í: F j ( ) p( ) pro < + j pro pro < j, j - do tabulky s zapíšeme seazeé hodoty promé, jejch etost, relatví etost a z ch odvodíme emprckou dstrbuí fukc: Orgálí data Seazeé hodoty a Absolutí etost seazeých hodot Relatví etost seazeých hodot p Emprcká dst. fukce F(a ) 9 / 8 / / 7 7 / / 43 34 / 3/ 9 35 / 5/ 47 4 / 6/ 4 4 / 7/ 34 43 / 8/ 34 47 / 9/ 4 8 / / 35-4 -

Z defce emp. dst. fukce F() tedy plye, že pro všecha meší ež 9 je F() rova ule, pro vtší ež 9 a meší ebo rova je F() rova /, pro vtší ež a meší ebo rova 7 je F() rova / + /, atd. ( ; 9 ( 9 ; ( ; 7 ( 7 ; 34 ( 34 ; 35 F() / / 3/ 5/ ( 35 ; 4 ( 4 ; 4 ( 4 ; 43 ( 43 ; 47 ( ; 8 47 ( 8 ; ) F() 6/ 7/ 8/ 9/ / / Emprcká dstrbuí fukce...8 F().6.4.. - 4 6 8 Prvodce studem: Zvládl jste to? Gratuluj. Pokud jste s píkladem ml jaké problémy, doporuuj Vám, abyste s pasáž o kvatlech a emprcké dstrbuí fukc zovu dklad prostudoval eí to aposled, co o ch slyšíte. Výklad: Až dosud jsme se zabýval peváž statstckým charakterstkam umožujícím pops polohy promé, tj. míram polohy. Prmry, modus, stej jako medá vyjadují pomyslý sted promé, eíkají však c o rozložeí jedotlvých hodot promé kolem tohoto stedu, tj. o varablt promé. Je zejmé, že ím vtší je rozptýleost hodot promé kolem jejího pomyslého stedu, tím meší je schopost tohoto stedu reprezetovat celou promou. - 4 -

Následující t statstcké charakterstky ám umožují pops varablty (rozptýleost) výbrového souboru, ebol pops rozptylu jedotlvých hodot kolem stedu promé azýváme je tedy míram varablty. (Z dosud zmíých statstckých charakterstk zaazujeme mez míry varablty shorth a terkvartlové rozptí.) Výbrový rozptyl s je ejrozšíejší mírou varablty výbrového souboru. Urujeme jej podle vztahu: ( ) s tz. výbrový rozptyl je dá podílem soutu kvadrátu odchylek jedotlvých hodot od prmru a rozsahu souboru sížeého o jedku. Mez základí vlastost výbrového rozptylu patí:. Výbrový rozptyl kostaty je rove ule, ebol: jsou-l všechy hodoty promé stejé, má soubor ulovou rozptýleost a R. ( ) ( y a + ) ( y y) : s s ebol: pteme-l ke všem hodotám promé lbovolou kostatu, výbrový rozptyl promé se ezmí b R 3. ( ) ( y b ) ( y y) : s s b ebol: vyásobíme-l všechy hodoty promé lbovolou kostatou (b), výbrový rozptyl promé se zvtší kvadrátem této kostaty (b krát) Nevýhodou použtí výbrového rozptylu jakožto míry varablty je to, že rozmr této charakterstky je druhou mocou rozmru promé. (Nap. je-l promou deí tržba uvedea v K, bude výbrový rozptyl této promé vyjáde v K.) Teto edostatek odstrauje další míra varablty, a tou je: - 43 -

Výbrová smrodatá odchylka s je defováa prost jako kladá odmoca výbrového rozptylu: s s ( ) Nevýhodou výbrového rozptylu výbrové smrodaté odchylky je ta skuteost, že eumožují porovávat varbltu promých vyjádeých v rzých jedotkách. Která promá má vtší varabltu výška ebo hmotost dosplého jedce? Na tuto otázku ám dá odpov, tzv. varaí koefcet. Varaí koefcet V vyjaduje relatví míru varablty promé. Podle íže uvedeého vztahu jej lze staovt pouze pro promé, které abývají výhrad kladých hodot. Varaí koefcet je bezrozmrý, uvádíme-l jej v [%], hodotu získaou z defího vzorce vyásobíme %. s V ešeý píklad: Frma vyrábjící tabulové sklo vyvula mé ákladou techolog pro zlepšeí odolost skla v žáru. Pro testováí bylo vybráo 5 tabulí skla a rozezáo a polovu. Jeda polova pak byla ošetea ovou techologí, zatímco druhá byla poecháa jako kotrolí. Ob polovy pak byly vystavey zvyšujícímu se psobeí tepla, dokud epraskly. Výsledky byly ásledující: Mezí teplota (sklo prasklo) [ o C] Stará techologe Nová techologe y 475 485 436 39 495 5 483 46 46 488 Porovejte ob techologe pomocí základích charakterstk eploratorí statstky (prmru a rozptylu, pop. smrodaté odchylky). - 44 -

ešeí: - Nejprve se pokusíme porovat ob techologe pouze za pomocí prmru: Prmr pro starou techolog: 475 + 436 + 5 + 46 463, o [ C] Prmr pro ovou techolog: y y 485 + 39 + 5 + 488 468,6 o [ C] Na základ vypoteých prmr bychom mohl íc, že ovou techolog doporuujeme, povadž mezí teplota je p ové techolog tém o 6 o C vyšší. A co a to míry varablty? Stará techologe: Výbrový rozptyl: s ( ) ( 475 463, ) + ( 436 463, ) + + ( 46 463, ) 5 96,3 o [ C ] Výbrová smrodatá odchylka: ( ) s s 96,3 3, 3 o [ C ] Nová techologe: Výbrový rozptyl: s ( y y) ( 485 468,6) + ( 39 468,6) + + ( 488 468,6) y 5 384,4 o [ C ] Výbrová smrodatá odchylka: ( y y) s s y 384,4 48, 8 o [ C ] - 45 -

Tady pozor. Výbrový rozptyl (výbrová smrodatá odchylka) vyšel pro ovou techolog mohem vyšší ež pro techolog starou. Co to zameá? Podívejte se a grafcké zázorí ameých dat. 6 Mezí teplota Mezí teploty pro ovou techolog jsou mohem rozptýlejší, tz. že tato techologe eí ješt dobe zvládutá a její použtí ám ezaruí zkvaltí výroby. V tomto pípad mže dojít k slému zvýšeí, ale také k slému sížeí mezí teploty proto by se mla ová techologe ješt vrátt do vývoje. Teplota 3 Stará Techologe Nová Zdrazme, že tyto závry jsou staovey pouze a základ eploratorí aalýzy, statstka ám abízí eaktjší metody pro rozhodutí takovýchto pípad (testováí hypotéz), s mž se sezámíte pozdj. Výklad: A yí se vrátíme k eploratorí statstce jako takové. Vzpomíáte s ješt a zmíku o odlehlých pozorováích? Dozvdl jste se, že jako odlehlá pozorováí ozaujeme ty hodoty promé, které se mmoád lší od ostatích hodot a tím ovlvují ap. reprezetatvost prmru. Nyí se dozvíte jak se tyto hodoty detfkují. Idetfkace odlehlých pozorováí (outlers) Ve statstcké pra se mžete setkat s kolka zpsoby detfkace odlehlých pozorováí. My s ukážeme t z ch.. Za odlehlé pozorováí lze považovat takovou hodotu, která je od dolího, resp. horího kvatlu vzdáleá více ež,5 ásobek terkvartlového rozptí. Tedy: [( <,5IQR) ( > +, 5IQR) ] je odlehlým pozorováím,5, 75. Za odlehlé pozorováí lze považovat takovou hodotu, jejíž absolutí hodota z-souadce je vtší ež 3, tj. hodota, která je od prmru vzdálejší ež 3s. Tedy: z sou. s z sou. > 3 ( ) je odlehlým pozorováím - 46 -

3. Za odlehlé pozorováí lze považovat takovou hodotu, jejíž absolutí hodota medáové souadce je vtší ež 3, tj. hodota, která je od medáu vzdálejší ež,483.mad. Tedy:,5 medáová sou.,483. MAD medáová sou. > 3 je odlehlým pozorováí ( ) m V kokrétím pípad s mžete pro detfkac odlehlých pozorováí zvolt lbovolé z tchto tí pravdel. Za zmíku stojí sad je to, že z-souadce je mé písá k odlehlým pozorováím ež medáová souadce. To je zpsobeo tím, že z-souadce se uruje a základ prmru a výbrové smrodaté odchylky, jež jsou sl ovlvy hodotam odlehlých pozorováí. Naprot tomu medáová souadce se uruje a základ medáu a MADu, které jsou v odlehlým pozorováím odolé. Pokud o které hodot promé rozhodeme, že je odlehlým pozorováím, je uté rozlšt o jaký typ odlehlost se jedá. V pípad, že odlehlost pozorováí je zpsobea: hrubým chybam, peklepy, prokazatelým selháím ldí techky... dsledky poruch, chybého meí, techologckých chyb... tz., záme-l píu odlehlost a pedpokládáme-l, že jž eastae, jsme opráv tato pozorováí vylout z dalšího zpracováí. V ostatích pípadech je uto zvážt, zda se vyloueím odlehlých pozorováí eppravíme o dležté formace o jevech vyskytujících se s ízkou etostí. Dalším charakterstkam popsujícím kvattatví promou jsou výbrová škmost a výbrová špatost. Vzorce podle chž se urují tyto charakterstky jsou pomr složté a proto se podle ch ru vtšou epoítá. Využívá je však velká ást statstckých program. Výbrová škmost (skewess) vyjaduje asymetr rozložeí hodot promé kolem jejího prmru. Výbrová škmost je defováa vztahem: α ( )( ) 3 ( ) s 3 A jak výbrovou škmost terpretujeme? α... hodoty promé jsou kolem jejího prmru rozložey symetrcky α >... u promé pevažují hodoty meší ež prmr α <... u promé pevažují hodoty vtší ež prmr - 47 -

6 6 6 5 5 5 4 4 4 3 3 3 3 4 5 6 7 3 4 5 6 7 3 4 5 6 7 > < Výbrová špatost (kurtoss) vyjaduje kocetrac hodot promé kolem jejího prmru. Výbrová špatost je defováa vztahem: β ( + ) ( )( )( 3) ( ) s 4 4 3 ( ) ( )( 3) A jak terpretujeme výbrovou špatost? β... špatost odpovídá ormálímu rozdleí (bude defováo pozdj) β >... špaté rozdleí promé < β... ploché rozdleí promé 7 3 6 5 4 3 8 6 4 5 5 5 3 4 5 6 7 3 4 5 6 7 3 4 5 6 7 > < Prvodce studem: Tak, a máte to takka vše za sebou všechy íselé charakterstky, které budeme využívat pro pops kvattatví promé máme defováy. Zbývá ám jedé ukázat s jak mžeme kvattatví promou zázort grafcky. Tak vzhru do toho, ebo o c složtého ejde. - 48 -

Výklad:.. Grafcké zázorí kvattatví promé Krabcový graf (Bo plot) Krabcový graf se ve statstce využívá od roku 977, kdy jej poprvé prezetoval statstk Tukey (azval jej bo wth whskers plot krabcový graf s vousama). Grafcká podoba tohoto grafu se v rzých aplkacích mír lší. Jedu z jeho verzí vdíte a výše uvedeém obrázku. 6 5 4 ma odlehlé pozorováí Odlehlá pozorováí jsou zázora jako zolovaé body, koec horího (pop. koec dolího) vousu pedstavují mamum ma shorth (pop. mmum m ) promé po vyloueí odlehlých pozorováí, víko krabce udává horí kvartl, do dolí kvartl, vodorová úseka uvt krabce ozauje medá. Svorka v krabce ukazuje shorth. 3 horí kvartl medá dolí kvartl m Z polohy medáu vzhledem ke krabc lze dobe usuzovat a symetr vtích 5% dat a my tak získáváme dobrý pehled o stedu a rozptýleost promé. Poz.: Z popsu krabcového grafu je zejmé, že jeho kostrukc zaíáme zakresleím odlehlých pozorováí a až poté vyzaujeme ostatí íselé charakterstky promé (m, ma, kvartly a shorth). íslcový hstogram (Stem ad leaf plot, Lodyha s lsty...) Jak jsme s ukázal, výhodou krabcového grafu je jeho jedoduchost, kdy ám však chybí formace o kokrétích hodotách promé. Chtl bychom proto jak pehled zapsat íselé hodoty výbru a k tomu ám slouží práv íslcový hstogram. Navíc ám teto graf dává dobrou pedstavu o škmost promé. Pedstavme s promou pedstavující prmré msíí platy zamstac ve státí správ. Prmrý msíí plat [K] 654 9 765 8 675 435 9 675 343 8 786 5 4 8 675 7 3 6 73 6 878 5 657 9 754 9 543 9 435 647 453 9 987 34-49 -

A vy yí stojíte ped problémem jak tato data zázort. Pokud se ad touto otázkou trochu zamyslíme, zjstíme, že pro aší formac ejsou tak dležté koruy a desetkoruy rozdílu. V tomto pípad se ám jedá pejmeším o stokoruy. Co kdybychom tedy formac o edležtých ádech zaedbal a zázorl setídá data pouze a základ vyšších ád? My jsme se rozhodl, že dležtý ád jsou pro ás Lodyha 6 78 7 8 66 9 456779 6 3366 4 44 5 46 8 7 stovky. Hodoty stojící o ád výš (v ašem pípad tsíce) zapíšeme setídé pod sebe, tak, že tvoí jakýs stoek (lodyhu), pemž pod graf uvedeme tzv. šíku lodyhy, která udává koefcet jímž se hodoty uvedeé v grafu ásobí. Druhý sloupec grafu, lsty, budou tvot íslce, reprezetujíc zvoleý dležtý ád, zapsovaé do píslušých ádk (opt seazeé podle velkost). A koe - tetí sloupec udává absolutí etost píslušé daým ádkm. Jste ze slovího popsu pokud zmate? Prohlédte s dklad obrázek prezetující íslcový hstogram pro áš pípad. Nap. prví ádek reprezetuje dv hodoty (6.7 a 6.8)* 3 K, tj. 67 K a 68 K (koruy a desetkoruy jsme zaedbal), šestý ádek reprezetuje také dv hodoty (.4 a.4)* 3 K, tj. dv osoby s prmrým msíím píjmem 4 K, atd. už je to jasjší, dokázal byste teto graf sestrojt sam? * 3 Šíka lodyhy Lsty etost Estují rzé modfkace tohoto grafu. Nap. zobrazovaé etost mohou být kumulatví, pemž v ádku, v mž se achází medá se uvádí absolutí etost (v závorce) a smrem k tomuto ádk se etost kumulují jedak od ejžších hodot, jedak od ejvyšších hodot. Lodyha 6 78 7 3 8 66 5 9 456779 (6) 3366 9 44 5 5 46 3 8 7 * 3 Šíka lodyhy Lsty Kumulatví etost Koe mžete amítout, že zpsobu kostrukce íslcového hstogramu je pro jede pípad vždy kolk. Nkde eí dáo, který ád promé je pro zazameáí dležtý a který už je 66788999999 558 9 zaedbatelý. (Srovával jsme platy dobe, když jsme je zazameal s pesost a stokoruy? Nestalo zázort íslcový hstogram vzhledem k tsíckoruám?) Toto rozhodutí leží vždy a tom, kdo data zpracovává. Mžeme uvést sad je jedu radu dlouhé lodyhy s krátkým lsty a krátké lodyhy s dlouhým lsty svdí o evhodé volb mítka. * 4-5 -

Shrutí: Kvaltatví - Kategorálí promá a) Nomálí promá - emá smysl uspoádáí Základí statstky pro pops omálí promé: etost Relatví etost Modus Grafcké zobrazeí omálí promé: b) Ordálí promá - má smysl uspoádáí Hstogram Výseový graf Základí statstky pro pops omálí promé: etost Relatví etost Kumulatví etost Relatví kumulatví etost Modus Grafcké zobrazeí omálí promé: Hstogram Výseový graf Paterv graf Polygo kumulatvích etostí (Galtoova ogva) Kvattatví - Numercká promá Míry polohy Prmr! Modus (sted shorthu) Kvatty (dolí kvartl, medá, horí kvartl, ) - 5 -

Míry varablty Iterkvartlové rozptí IQR,75, 5 Výbrový rozptyl Výbrová smrodatá odchylka Varaí koefcet ( ) s s s s V ( ) Výbrová škmost 3 ( ) α 3 ( )( ) s Výbrová špatost 4 ( ) ( ) + β 4 ( )( )( 3) s 3 ( ) ( )( 3) Idetfkace odlehlých pozorováí Z souadce Medáová souadce z sou. s,5 medáová sou.,483. MAD Grafcké zobrazeí umercké promé: Emprcká dstrbuí fukce Bo plot (Krabcový graf) Stem ad leaf (Lodyha s lsty, íslcový hstogram) - 5 -

Otázky. ím se zabývá eploratorí statstka?. Charakterzujte základí typy promých. 3. Které statstcké charakterstky mohou obsahovat tabulky etost (pro který typ promé)? 4. Defujte základí statstky popsující kvaltatví promou. 5. Co jsou to odlehlá pozorováí a jak je detfkujeme? 6. Na výskyt odlehlých pozorováí ve výbru je ctlvý: a) Medá b) Artmetcký prmr c) Horí kvartl 7. Defujte základí míry varablty. 8. Co je to emprcká dstrbuí fukce? 9. Jaké jsou možost grafcké prezetace kvaltatví (kvattatví) promé? - 53 -

Úlohy k ešeí. Následující hstogram zobrazuje platy zamstac (v ts. K) jedé akcové spoleost. 8 6 64 56 4 4 4 8 Které z ásledujících výrok jsou urt chybé, pop. eovtelé? a) Modus plat je tída od 7 do 8ts. K b) Celkový poet zamstac frmy (zahrutých do przkumu) je 5 c) Prmrý plat í 7 977,- K. Teto krabcový graf vypovídá o výdlcích (v ts. K,-) studet bhem letích prázd. 9 Ozate výroky, které zjev eodpovídají zobrazeé skuteost. a) Studet s vydlal mamál 9 ts. K,- b) Iterkvartlové rozptí výdlk í zhruba ts. K,- c) Polova studet s vydlala mé ež cca. ts. K,- d) Nejkratší terval, v mž leží alespo 5% výdlk (Shorth), je cca (5;5) ts. K,- - 54 -

3. Následující graf Stem & leaf zobrazuje roí úhr srážek (v mm) a Lysé hoe v letech 966 996. 4 73 86 5 5 7 5 53 6 7 6 5 9 3 3 33 33 4 6 64 65 7 98 () 7 5 4 5 4 48 59 98 8 9 3 37 4 9 Multply by Ozate výroky, které zjev eodpovídají zobrazeé skuteost. a) Údaje ve tetím sloupc udávají kumulatví etost (p kumulac shora a zdola, hodota ve tetím ádku udává absolutí etost) b) Medá roích úhru srážek í 668mm. c) V roce 994 byl roí úhr srážek a Lysé hoe 83mm. d) V roce 966 byl zazameá ejžší roí úhr srážek a Lysé hoe. 4. Následující data pedstavují zem výroby automoblu. Data vyhodote (etost, rel. etost, resp. kum. etost a kum. rel. etost, modus) a grafcky zázorte (hstogram, výseový graf). USA USA Nmecko R Nmecko Nmecko Nmecko R R R USA Nmecko 5. Následující data pedstavují dobu ekáí [m] zákazíka a obsluhu. Zakreslete bo plot a graf stem ad leaf. 8 9 5 5 4 3 7 6. P dopravím przkumu byla sledováa vytížeost vjezdu do urté kžovatky. Studet, provádjící przkum, s vždy p askoeí zeleého svtla zapsal poet aut, ekajících ve frot u semaforu. Jeho zapsaé výsledky jsou: 3 5 3 3 5 7 8 8 6 8 5 5 8 5 4 7 5 6 3 4 8 4 4 5 5 4 3 3 4 9 6 5 3 5 3 5 7 5 8 4 4 3 5 6 4 6 9 3 6 3 5 3 5 3 7 6 3 7 5 6 Nakreslete krabcový graf, emprckou dstrbuí fukc a vypotte ásledující výbrové statstky: prmr, výbrová smrodatá odchylka a terkvartlové rozptí. - 55 -

ešeí:. b), c). b), d) 3. b), c), d) 4. 5. Kumulatví etost a kumulatví relatví etost emá v tomto pípad smysl. Modem, tj. zemí, v íž bylo vyrobeo ejvíce automobl, je Nmecko. - 56 -

Stem ad leaf 5 7 8 3 9 4 7 () 4 3 3 4 5 * 6.,5 3;,75 6; IQR 3 Emprcká dstrbuí fukce,,8 F(),6,4, -4-4 6 8 4 poet aut - 57 -