APLIKOVANÁ STATISTIKA pro FRRMS

Podobné dokumenty
Statistická šetření a zpracování dat.

Třídění a významné hodnoty

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM

4. Třídění statistických dat pořádek v datech

POROVNÁNÍ MEZI SKUPINAMI

Diskrétní náhodná veličina

2. Statistická terminologie a vyjadřovací prostředky Statistická terminologie. Statistická jednotka

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ

Energie elektrického pole

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla

2.3 Prezentace statistických dat (statistické vyjadřovací prostředky)

Matematika I A ukázkový test 1 pro 2018/2019

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

Ivana Linkeová SPECIÁLNÍ PŘÍPADY NURBS REPREZENTACE. 2 NURBS reprezentace křivek

7. Rozdělení pravděpodobnosti ve statistice

Čísla a aritmetika. Řádová čárka = místo, které odděluje celou část čísla od zlomkové.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d

2. Definice pravděpodobnosti

Neparametrické metody

MODELOVÁNÍ A SIMULACE

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...)

REGRESNÍ ANALÝZA. 13. cvičení

Vícekriteriální rozhodování. Typy kritérií

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První

Regresní a korelační analýza

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina

STATISTIKA PRO NELÉKAŘSKÉ ZDRAVOTNICKÉ OBORY

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou)

ANALÝZA RIZIKA A JEHO CITLIVOSTI V INVESTIČNÍM PROCESU

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

Náhodné chyby přímých měření

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz

LOGICKÉ OBVODY J I Ř Í K A L O U S E K

Název DUM: VY_32_INOVACE_2B_16_ Tvorba_grafů_v_MS_Excel_2007

Simulační metody hromadné obsluhy

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

Pojem a úkoly statistiky

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST

KGG/STG Statistika pro geografy

Renáta Bednárová STATISTIKA PRO EKONOMY

2. Bodové a intervalové rozložení četností

Spojité regulátory - 1 -

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech.

Analýza závislosti veličin sledovaných v rámci TBD

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Úvod Terminologie Dělení Princip ID3 C4.5 CART Shrnutí. Obsah přednášky

PODKLADY PRO PRAKTICKÝ SEMINÁŘ PRO UČITELE VOŠ. Logaritmické veličiny používané pro popis přenosových řetězců. Ing. Bc. Ivan Pravda, Ph.D.

10. N á h o d n ý v e k t o r

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla

8. Normální rozdělení

2.5. MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10

Staré mapy TEMAP - elearning

radiační ochrana Státní úřad pro jadernou bezpečnost

í I Průchod a rozptyl záření gama ve vrstvách materiálu Prof. Ing. J. Šeda, DrSc. KDAIZ - PJPI

FYZIKA I. Pohybová rovnice. Prof. RNDr. Vilém Mádr, CSc. Prof. Ing. Libor Hlaváč, Ph.D. Doc. Ing. Irena Hlaváčová, Ph.D. Mgr. Art.

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2

Škály podle informace v datech:

Metody analýzy rizika. Předběžné hodnocení rizika. Kontrolní seznam procesních rizik. Bezpečnostní posudek

ANALÝZA A KLASIFIKACE DAT

Základy popisné statistiky

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

Pracovní list č. 3: Pracujeme s kategorizovanými daty

6 LINEÁRNÍ REGRESNÍ MODELY

URČOVÁNÍ TRENDŮ A JEJICH VÝZNAM PRO EKONOMIKU

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522

ČVUT FEL. X16FIM Finanční Management. Semestrální projekt. Téma: Optimalizace zásobování teplem. Vypracoval: Marek Handl

Transformace dat a počítačově intenzivní metody

Osově namáhaný prut základní veličiny

KGG/STG Statistika pro geografy

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Cykly a pole

Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička

Statistika pro geografy

permutace, popisující nějaké symetrie, je i π permutace, popisující nějakou symetrii.

EKONOMICKO-MATEMATICKÉ METODY

u (x i ) U i 1 2U i +U i+1 h 2. Na hranicích oblasti jsou uzlové hodnoty dány okrajovými podmínkami bud přímo

Aplikace simulačních metod ve spolehlivosti

Neřešené příklady k procvičení

Výsledný graf ukazuje následující obrázek.

7. Analýza rozptylu jednoduchého třídění

Ing. Barbora Chmelíková 1

Výslednice, rovnováha silové soustavy.

NÁHODNÁ VELIČINA. 3. cvičení

3. Reálná čísla. většinou racionálních čísel. V analytických úvahách, které praktickým výpočtům

Regresní analýza 1. Regresní analýza

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

POLYMERNÍ BETONY Jiří Minster Ústav teoretické a aplikované mechaniky AV ČR, v. v. i.

Transkript:

Mendelova zemědělská a lesncká unverzta v Brně Fakulta regonálního rozvoje a meznárodních studí APLIKOVANÁ STATISTIKA pro FRRMS Modul : Datový soubor zjšťování, prezentace a zpracování Prof. Ing. Bohuml Mnařík, CSc. Brno 2009

2

Vysvětlení použtých symbolů Průvodce studem objevuje se v úvodu a závěru modulu, zahajuje každou lekc, formuluje hlavní problémy, snaží se motvovat čtenáře, poukazuje na návaznost v problematce Abecední rejstřík použtých pojmů v úvodní část každé lekce. Rekaptuluje všechny důležté odborné termíny zavedené v lekc. Σ Bleskové otázky/úkoly v textu. Pokud jsou číslovány, čtenář nalezne v závěru lekce příslušné odpověd. Čtenář by se je měl snažt splnt dříve, než postoupí dál. Souhrn problematky lekce. Následuje po textu lekce. Odpověd na bleskové otázky v textu lekce. Cvčení k lekc. Pokud je to účelné a možné, nalezne čtenář řešení úkolů na konc modulu. Klíč ke cvčením ke všem lekcím v závěru modulu. Struktura modulu ttulní lst, použté symboly, struktura modulu a lekcí, obsah modulu, průvodce studem modulu úvod, jednotlvé lekce modulu, klíč ke cvčením ke všem lekcím, průvodce studem modulu závěr. Struktura lekce průvodce studem lekce, abecední rejstřík pojmů, text lekce proložený bleskovým otázkam a úkoly, souhrn lekce, odpověd na bleskové otázky, cvčení k lekc. 3

Obsah modulu Průvodce studem modulu úvodní část Lekce Zjšťování a typy dat.. Metody zjšťování dat.2. Výběrová zjšťování.3. Statstcká data.4. Tabulková a grafcká prezentace dat.5. Chyby v datech Lekce 2 Třídění a významné hodnoty 2.. Bodové třídění 2.2. Intervalové třídění 2.3. Významné hodnoty 2.4. Aproxmace typcké hodnoty a kvantlů u ntervalového třídění Lekce 3 Měření koncentrace 3.. Pojem koncentrace 3.2. Koncentrační křvka 3.3. Medál 3.4. Gnův ndex Klíč ke cvčením Průvodce studem závěrečná část Dodatek Použtí MS Excel pro tvorbu grafů 5 6 6 7 8 9 2 5 5 7 9 2 24 24 24 25 26 27 28 29 4

Ldé žjí v zajetí mnoha paradoxních omylů. Vezměme dva extrémní případy. Běžný lak nedokáže žádným způsobem předpovědět zatmění Slunce nebo Měsíce. Tyto jevy se dostavují velm nepravdelně a an v horzontu několka ldských žvotů není možno sebepečlvějším pozorováním dospět k jejch předpověd. Běžný člověk je tedy může oprávněně považovat za výsledek jakéhos nebeského chaosu a čsté náhody a odbýt je mávnutím ruky. Přesto jsou tyto jevy důsledkem velm přesné nebeské mechanky a odborníc jsou schopn je předvídat s velkou přesností. To, že se překvapvě dostaví nečekané zatmění, je možno (na rozdíl od ropných, fnančních, poltckých a mnoha jných krzí) zcela vyloučt. Na druhé straně lak očekává, že trubka o světlost 00 mm má světlost 00 mm, šroub o délce 50 mm má délku 50 mm, že balení másla zakoupené v obchodě má hmotnost 250 g, stejně jako to, že v půlltrové lahv pva se nachází přesně 500 ml tohoto moku. Zkrátka, považuje tyto velčny za konstantní. To ovšem není pravda. Odborník ví, že jde o realzace náhodných velčn, neboť konstruovat výrobní zařízení č plncí lnku, které pracují s absolutní přesností je, ne-l nemožné, tak alespoň velm drahé a především zbytečné. Odhlédneme-l od těchto extrémů a věnujeme se běžným náhodným jevům, jako jsou např. hustota osídlení, porodnost, příjmy domácností, apod., zjšťujeme, že je-l k dspozc zaznamenaný dostatečně početný soubor případů, začíná působt zákon velkých čísel a to, co bylo v jednotlvých zolovaných případech nepředvídatelné, začíná projevovat jstou zákontost a předvídatelnost. Hodíme-l jedenkrát jednou mncí, můžeme padnutou stranu předpovědět s 50% rzkem o- mylu. Ovšem čím víckrát hodíme, tím s větší jstotou očekáváme, že počet padnutých líců a rubů se bude téměř rovnat. Statstka, tak jak j prezentuje tato studjní opora, je exaktní věda (př preczním vedení výkladu by bylo možno j chápat jako určté odvětví matematky), jejímž úkolem je zjšťovat data (tj. provádět nejrůznější statstcká šetření), získaná data zpracovávat (např. podle různých hledsek uspořádat nebo třídt), zpracovaná data na různé úrovn analyzovat (typcky měřt různé vlastnost dat pomocí statstckých charakterstk), získané výsledky analýzy přměřeně prezentovat (zpravdla v tabulkové nebo grafcké podobě) pro potřeby odborné č lacké veřejnost. Tímto způsobem je statstka angažována v nejrůznějších oblastech ldské čnnost. Charakterstckým pro statstcká data je hromadnost pozorování (není problém shromáždt rozsáhlý počet případů), proměnlvost jednotlvých případů varablta. Statstka je emprckou vědou a poznatky, ke kterým dospívá, jsou tudíž vyvozeny z reálné skutečnost. Statstcké postupy a metody lze uplatnt také ve sféře studa problematky regonálního rozvoje. Data z této oblast splňují oba základní atrbuty (hromadnost a varabltu), proto vytvářejí rozsáhlé pole působnost pro uplatnění statstky. Smyslem použtí statstky je odhalt a popsat základní zákontost a pravdla, která stojí za zdánlvě (a jen na první povrchní pohled) chaotckou a nahodlou skutečností. Tento úvodní modul se ve třech lekcích věnuje zjšťování statstckých dat v nejrůznějších stuacích, jejch prezentac prostřednctvím grafů a tabulek, jejch zpracování zejména pomocí bodového a ntervalového třídění, stanovení významných hodnot netříděného a tříděného datového souboru, měření koncentrace datového souboru. 5

Lekce Zjšťování a typy dat Pokud má statstka naplnt své poslání, je třeba nejprve získat kvaltní a spolehlvé údaje data. Pod pojmem získávání dat je možno s představt rozsáhlý rejstřík postupů, od klasckých exaktních laboratorních měření např. fyzkálních velčn, přes získávání poněkud vágnějších a méně spolehlvých dat z evdence různých úřadů, nsttucí č frem, až po organzování různých dotazníkových šetření č řízených rozhovorů s respondenty v průzkumech veřejného mínění, socologckých výzkumech apod. Data, výsledky zpracování a výsledky analýzy je třeba přměřeným způsobem prezentovat. Základním problémem každých dat je exstence chyb, případně chybějících hodnot. Rámcový výklad problematky zjšťování dat, jejch typů a vlastností obsahuje právě tato první lekce. alternatvní znak; anketa; časová řada; číselný znak; datový soubor; hodnota znaku; hrubá chyba; chybějící hodnota; kardnální znak; matematcká statstka; množný znak; náhodná chyba; neúplné zjšťování; nevýběrová chyba; nomnální znak; obměna znaku; ordnální znak; popsná statstka; populace; pořadový znak; pravděpodobnostní výběr; prostý náhodný výběr; prosté pozorování; průřezová data; rozsah souboru; řízený experment; slovní znak; systematcká chyba; úplné zjšťování; výběrová chyba; výběrová jednotka; výběrový soubor; výběrové zjšťování; základní soubor; zjšťování. Metody zjšťování dat Podle podmínek zjšťování dat rozlšujeme řízené expermenty a prostá pozorování. Řízený experment znamená, že podmínky zjšťování jsou pod kontrolou expermentátora. Rušvé faktory jsou elmnovány, faktory jejchž vlv sledujeme jsou naopak fxovány na expermentátorem daných úrovních. Data vykazují přměřenou varabltu. Exstuje představa o chybách měření. Běžně se hovoří o plánování expermentů. Řízené expermenty zpravdla probíhají ve zkušebnách a laboratořích (tedy do jsté míry v umělých podmínkách), vyžadují čas a náklady, které mohou být někdy nepřměřené. V určtých oblastech jsou expermenty vyloučeny (nelze např. expermentálně ovlvňovat ceny nemovtostí, úrokové sazby z vkladů apod.). Prosté pozorování znamená, že podmínky zjšťování nejsou pod kontrolou pozorovatele. Rušvé faktory nejsou elmnovány. Pozorovatel nemá vlv an na faktory, jejchž působení hodlá sledovat a ty pak zpravdla nemají dostatečnou varabltu, aby se jejch vlv mohl průkazně projevt. Chybí představa o možných chybách pozorování. Prosté pozorování zpravdla probíhá v terénu, tedy v reálných podmínkách. Zpravdla vyžaduje menší čas a náklady. Používá se tam, kde je experment vyloučen nebo pokud není možno z časových nebo fnančních důvodů řízený experment zorganzovat. Je zřejmé, že v oblast regonálního rozvoje se běžně setkáme především s daty zjšťovaným v podmínkách prostého pozorování, bez možnost pozorovanou skutečnost jakkol ovlvnt. Najděte příklady řízených expermentů a prostých pozorování z vašeho dosavadního studa č praxe. 6

Podle úplnost zjšťování dat rozlšujeme úplná a neúplná zjšťování. Úplná zjšťování se snaží podchytt všechny exstující případy, kterých zpravdla bývá velm mnoho. Jsou časově a fnančně velm náročná a mnohdy tudíž praktcky neprovedtelná. Někdy se jm ovšem není možno vyhnout, protože například povnnost úplné evdence určtých jevů a událostí vyplývá ze zákona. Množna (mnohdy jen hypotetcká) zahrnující všechny možné případy se nazývá populace např. populace volčská, zákazncká, důchodců atd. atd. Neúplná zjšťování cíleně a vědomě zaznamenávají jen určtý vzorek (za chvíl použjeme pojem výběr) exstujících případů. Jejch cílem je šetřt čas a náklady. Někdy se jm nelze vyhnout. Jsou náročná na volbu stratege určení vzorku. Př tom se často využívá zákonů pravděpodobnost. I př neúplných zjšťováních je konečným cílem poznat zákontost, kterým se řídí jev jako celek. Základním předpokladem je v této souvslost reprezentatvnost vzorku. Neúplná zjšťování, jejchž výsledkem je získání reprezentatvního vzorku, se nazývají výběrová zjšťování. Kam zařadíme z hledska úplnost zjšťování např. evdenc dopravních nehod, sčítání ldu, výskyt určtého nákupního chování, cestování obyvatel mmo regon (turstka), preferenc určtého způsobu trávení volného času. ( ).2 Výběrová zjšťování Pravděpodobnostní výběr (také náhodný výběr) je základní metodou získání reprezentatvního vzorku. Pravděpodobnostní výběr předpokládá určení tzv. výběrové jednotky (stanovení toho, co se vybírá: jednotlvé regony, jednotlvé obce vybraného regonu, jednotlví obyvatelé vybrané obce); z příkladů vyplývá velm různá velkost výběrové jednotky v závslost na účelu zkoumání, stanovení pravděpodobnost zahrnutí výběrové jednotky do výběru (tento problém odsuneme stranou), ponechání náhodě (např. použtím losování nebo jné adekvátní tzv. znáhodňovací technky), která jednotka bude zahrnuta do výběru. Pravděpodobnostní výběr tedy představuje poměrně složtou a promyšlenou proceduru a nelze jej zaměňovat např. s namátkovým nebo samovolným výběrem, jejchž výsledkem reprezentatvní vzorek není. Zejména musíme upozornt, že často využívaná anketa rozhodně nesplňuje požadavky, kladené na reprezentatvnost vzorku. Pravděpodobnostní výběr lze klasfkovat na výběr s opakováním a výběr bez opakování (podle toho zda jednou vybraná jednotka může č nemůže být opakovaně zahrnuta do výběru), výběr se stejným a výběr s nestejným pravděpodobnostm, přímý neomezený výběr a složtěj uspořádaný výběr. Prostý náhodný výběr je nejjednodušším případem pravděpodobnostního výběru. Je defnovaný jako přímý neomezený výběr se stejným pravděpodobnostm prováděný s opakováním č bez opakování. Musíme ovšem upozornt na to, že v prax je právě prostý náhodný výběr jedním z nejméně vhodných výběrů. Daleko častěj jsou výběry organzovány jako složtěj uspořádané, kdy se cíleně využívá známých vlastností populace. Tato problematka ovšem přesahuje rámec našeho výkladu. Základní soubor populace je množna všech exstujících případů. Jejch počet rozsah populace se označuje písmenem N. 7

Výběrový soubor výběr je množna případů zahrnutých do výběru. Počet jednotek se nazývá rozsah výběru a označuje se písmenem n. V prax jde př výběru o to, mnmalzovat rozsah výběru (šetřt čas a peníze) př maxmalzac jeho nformační hodnoty. Pokud způsob získání a reprezentatvnost vzorku nejsou podstatné, hovoří se prostě o datovém souboru. Rozsah datového souboru se označuje rovněž symbolem n. Popsná statstka se zabývá popsem (deskrpcí) datového souboru. Matematcká statstka (statstcká ndukce) zobecňuje závěry získané na výběrovém souboru (reprezentatvním vzorku) pro celou populac. Popsná a matematcká statstka jsou dvě hlavní statstcké dscplíny. Matematcká statstka př tom vychází z počtu pravděpodobnost. Vyplývá to jak ze způsobu pořízení výběru, tak ze způsobu nakládání s nformacem zjštěným z výběru. Analyzujte Kam bychom v termnolog výběrových zjšťování zařadl např. losování Sportky? Co představuje 49 čísel přpravených v losovacím zařízení, jak nazveme 6 vylosovaných čísel, jaká je zde použta znáhodňovací technka? ( 2) případ tažení n drobných výrobků z krabce obsahující N výrobků. Všmněte s rozdílu mez výběrem s opakováním a bez opakování (např. maxmálně možný počet tahů, možnost opakovaně vybrat stejný výrobek apod.)..3 Statstcká data Vlastnost, které jsou aktuálním předmětem šetření, se v termnolog statstky nazývají znaky. V této souvslost pozor na termnologckou kolz (např. pojem znak v nformatce). Jako příklady statstckých znaků můžeme uvést např. počet obyvatel obce, počet členů domácnost, věk, pohlaví nebo povolání respondenta a mnoho dalších. Z těchto příkladů vyplývá, že znaků je mnoho typů, čemuž také odpovídají velm různorodá statstcká data. Základem klasfkace je dělení znaků na číselné a slovní. Číselný znak (zde lze využít alternatvně pojem velčna č proměnná) vykazuje číselné hodnoty, které mají prmárně význam velkost (např. počet členů domácnost, počet obyvatel obce, pořzovací cena nemovtost v ts. Kč). Číselné znaky, které budou v našem výkladu poněkud převažovat, můžeme klasfkovat jako měřtelné a pořadové. Měřtelný kardnální znak je výsledkem měření (např. měření ve fyzkálním slova smyslu). U kardnálních znaků je vedle relace větší, menší, roven, defnován rozdíl (o kolk) a u některých dokonce podíl (kolkrát). V tomto případě záleží na poloze nuly poměrový charakter mají jen znaky s přrozenou nulou. Znaky, které poměrový charakter nemají, se nazývají ntervalové. Pořadový ordnální znak vyjadřuje stupeň výskytu nějaké vlastnost a vztahují se k němu pouze relace větší, menší, roven. Kardnální znak lze převést na ordnální očíslováním jeho hodnot pořadovým čísly. Tímto je ztracena nformace o rozdílech mez hodnotam. Slovní nomnální znak vykazuje dvě nebo více slovně vyjádřených obměn (kategorí). Obměny nomnálních znaků lze číselně kódovat, čísla však postrádají význam velkost. Pokud nomnální znak vykazuje jen dvě obměny, jedná se o alternatvní (bnární, dchotomcký, dvojný) znak. Pokud nomnální znak vykazuje více než dvě obměny, hovoří se o množném znaku. Najděte příklady kardnálních, ordnálních a nomnálních znaků. Najděte příklady ntervalových a poměrových znaků (o kolk/kolkrát je jedna hodnota větší/menší než druhá). Najděte příklady alternatvních a množných slovních znaků. Zaujměte stanovsko k možnost vyjádřt o kolk/kolkrát/o kolk procent je jedna hodnota větší než druhá v případě (a) porovnání počtu obyvatel dvou obcí (např. 000 a 2200), (b) porovnání volebního zsku dvou stran v % (např. 40 a 5 %), (c) porovnání průměrných únorových teplot ve dvou letech změřených ve C (např. 4 a +2). 8

Statstcké údaje data jsou shromážděné hodnoty číselných, resp. obměny slovních znaků. Typckým prostředím pro uchování statstckých dat je tabulka tabulkového procesoru, případně mohou být data organzována v databáz, což usnadňuje jejch skladování, údržbu a aktualzac, stejně jako jejch operatvní získávání z velm rozsáhlých databází. V této souvslost se běžně používají pojmy jako datový sklad, datová pumpa, dolování dat apod. tyto termíny svědčí doslova o průmyslovém charakteru těchto čnností. K označování číselných znaků budeme používat velká písmena z konce abecedy, tj. např. X, Y, Z,. Jejch konkrétní hodnoty pak označíme odpovídajícím malým písmeny (x, y, z, ). Př rozsahu souboru n tvoří zjštěné hodnoty znaku X datovou řadu (datový vektor) x, x2,..., x,..., xn. Index souvsí přtom s pořadím zjšťování, takže datová řada je prmárně neuspořádaná. Datovou řadu umísťujeme zpravdla do jednoho sloupce tabulkového procesoru. n n 2 2 Seznamte se důkladně s významem zápsů n x, x, x. Vypočtěte hodnoty těchto výrazů pro datovou řadu x : 24, 6, 9, 0, 32. Mmořádně s výsledky: 49; 937; = = = 240 V prncpu se můžeme setkat s datovou řadou, jejíž jednotlvé hodnoty se vztahují ke shodnému časovému okamžku nebo ntervalu, ale různým případům (údaje o počtu obyvatel v souboru obcí jednoho regonu, o cenách stavebních pozemků v různých částech katastru obce, o zadluženost frem v určtém odvětví nebo regonu). Takováto statcká data nazýváme průřezovým údaj. Někdy je ovšem vhodné měřt dynamku, vývoj, určtého jevu v čase. Pak se jednotlvé údaje vztahují zpravdla k jednomu případu, ale k různým časovým obdobím (vývoj cen stavebních pozemků v určté lokaltě v období několka let, počet nově regstrovaných uchazečů o prác v jednotlvých měsících roku v působnost jednoho úřadu práce apod.). V tomto případě má datová řada charakter řady časové. V dalším výkladu se nejprve budeme věnovat datům průřezového charakteru. Časové řady budou předmětem našeho zájmu až pozděj..4 Tabulková a grafcká prezentace dat Statstcká tabulka je formálním prostředkem prezentace statstckých údajů, výsledků zpracování analýzy. S různým statstckým tabulkam se během dalšího výkladu budeme běžně setkávat. Př konstrukc tabulky (jejíž techncká stránka je dnes jž do značné míry záležtostí použtého textového nebo tabulkového procesoru) je třeba dodržovat některá pravdla, aby výsledný produkt splňoval jak nformační hodnotu, tak estetcké hledsko. Mez základní prvky tabulky patří: Číslo a název tabulky (ty jsou zcela nezbytné pokud dokument obsahuje více než jednu tabulku, aby bylo možno se na správnou tabulku jednoduše odvolat). Řádky a sloupce tabulky, přčemž podle potřeby často poslední řádek/sloupec slouží jako součtový. Číselné pole tabulky je tvořeno řádky a sloupc tabulky. Políčko (někdy po vzoru textových procesorů buňka) je základní jednotkou tabulky na průsečíku určtého řádku a sloupce. Záhlaví tabulky je tvořeno prvním řádkem tabulky, který zpravdla obsahuje názvy sloupců. Legenda tabulky je tvořena prvním sloupcem tabulky, který zpravdla obsahuje názvy řádků. Vysvětlvky a poznámky slouží k mnmalzac případných nejasností. Zdroj údajů pod tabulkou je třeba uvést zdroj údajů v tabulce obsažených, např. Statstcká ročenka ČR, vlastní údaje autora apod. Základní podmínkou srozumtelnost tabulky je, aby každé políčko tabulky bylo vyplněno: číslem, textem nebo smluvenou značkou. Mez běžně používané smluvené značky (jejch význam není třeba odborníkům zvlášť vysvětlovat) patří: 9

ležatá čárka ( ), která udává, že se nevyskytl žádný případ, případně nulovou hodnotu, ležatý křížek ( ) symbolzuje, že vyplnt políčko by bylo nelogcké, nula (0) umožňuje vyčstt tabulku od malých hodnot a udává, že hodnota v příslušném políčku nedosahuje polovny použté měrné jednotky (tj. např. označuje hodnotu menší než 500 kg v případě, že čísla jsou uváděna v tunách), tečka (.) v políčku tabulky nahrazuje neznámý nebo nespolehlvý údaj. Problematku prezentačních tabulek lustrujeme na jednoduchém příkladě (tabulka.). Tab.. Roční spotřeba nejdůležtějších druhů potravn na obyvatele v ČR (statstcká tabulka a její prvky) Legenda Rok Položka 995 2000 2002 Oblovny Maso celkem 2 Mléko a mléčné výrobky 3 Ovoce a zelenna 60,8 82,0 87,8 50, 36,3 79,4 24, 57,9 45,8 79,8 220,6 52,2 Celkem 580,7 587,7 598,4 Číslo a název Záhlaví Číselné pole Součtový řádek Nealkoholcké nápoje Pvo Víno 2,3 56,9 5,4 206,0 59,9 6, 246,0 59,9 6,2 Políčko Celkem 293,6 382,0 422, Potravny jsou uvedeny v klogramech, nápoje v ltrech 2 Včetně kostí a vntřností Vysvětlvky 3 Kromě másla (patří mez tuky) Zdroj údajů: Zpracováno podle Statstcké ročenky ČR, ročník 2005, tabulka 9 9, str. 279. Pramen O grafech platí ještě více než o tabulkách, že vytvořt graf, který dokonale splní svoj nformační funkc, je současně věda umění. Podobně jako u tabulek uvedeme nejprve prvky grafu: Pro číslo a název grafu platí totéž co pro tabulky. Grafcký obraz sestává z geometrckých prostředků (body, čáry, plochy, apod.), smluvených prostředků (tloušťky, typy a barvy čar, vybarvení nebo šrafování ploch apod.) a pomocných prostředků (jako jsou osy, stupnce, sítě apod.), které především usnadňují čtení grafu. Legenda grafu je klíčem ke smluveným prostředkům. Další prvky jako poznámky a vysvětlvky č zdroj údajů se shodují s tabulkam. Je zřejmé, že grafcké vyjádření poskytuje obrovskou škálu možností a prostředků. Proto je velm obtížné systematcky klasfkovat veškeré statstcké grafy a každý výčet v tomto směru je nutně jen uvedením vybraných příkladů: Takže například můžeme podle použté souřadncové soustavy rozdělt grafy na pravoúhlé, polární a grafy, které souřadncovou soustavu nevyžadují (např. obrázkové grafy pktogramy). Podle počtu dmenzí rozlšujeme grafy na plošné (2D) a prostorové (3D). Poslední pak na pravé 3D (všechny 3 dmenze mají význam) a nepravé 3D (zde třetí dmenze pouze vytváří prostorový efekt). Podle požadavků na přesnost na obou koncích pomyslné škály leží vědecké grafy (vysoké nároky na přesnost) a popularzační dgramy (umožňují základní orentac bez větších nároků na přesnost). 0

Podle použtých grafckých prostředků rozdělujeme grafy na bodové (tečkové), čárové (spojncové), pruhové (vodorovné) a sloupcové (svslé), kruhové, bublnové, koncké ( damanty, hvězdce, tváře ) a mnohé jné. Podle typu dat, která zobrazují, rozlšujeme velké množství grafů, z nchž uvedeme často využívané grafy vývoje a grafy struktury, kterým se společně říká obchodní grafy. Svoj skupnu mají také burzovní grafy. Obr..2 Příklady statstckých grafů Spojncový graf slouží zpravdla ke znázornění vývoje. Plochy mez čaram narozených a zemřelých v Českých zemích v letech 785 až 2005 jsou v tomto případě využty pro znázornění přrozeného přírůstku/úbytku obyvatelstva. Zdroj ČSÚ. Kartogram míry nezaměstnanost v jednotlvých okresech ČR k..2006. Míra nezaměstnanost je znázorněna barevným odstínem. Alternatvním řešením je např. ve 3D zobrazení znázornt míru nezaměstnanost jako nadmořskou výšku příslušného okresu. Zdroj ČSÚ. Graf Chernoffovy tváře je sofstkovaný graf (tváře nejsou pouhé obrázky jako u pktogramu, ale jejch prvky znázorňují hodnoty určtých ukazatelů). Ze vzhledu jednotlvých tváří snadno odhadnete úroveň kvalty žvota v jednotlvých regonech. Zdroj vlastní data.

Kartodagram věkové struktury obyvatelstva v Jhomoravském kraj a kraj Vysočna. Mapa slouží jen jako pozadí pro výsečové grafy, které znázorňují věkovou strukturu populace: předproduktvní složka (do 9 let), produktvní (20 až 64 let) a poproduktvní složka (65+) populace v obou krajích. Výsečové grafy jsou opatřeny 3D efektem a mají vysunutou poslední výseč (kategore 65+). Vdíme, že věková struktura v obou krajích je praktcky dentcká. Zdroj ČSÚ. Specální typy grafů jsou např. kombnace grafu a mapy, kterým se říká kartogramy (pokud je mapa nepostradatelnou součástí grafu) nebo kartodagramy (mapa slouží spíše k ozvláštnění grafu). Moderní jsou obrázkové grafy pktogramy. Některé grafy dovedou překvapt. Např. graf Chernoffovy tváře je poměrně komplkovaně sestrojený graf umožňující posoudt podobnost objektů, které jsou popsány několka znaky. Pokud se podíváte na obrázek znázorňující kvaltu žvota v šest regonech podle několka vybraných ukazatelů (hodnota každého z nch souvsí s některým prvkem tváře), jstě se budete v tom, co graf slbuje, snadno orentovat..5 Chyby v datech Údaje nelze zjšťovat bezchybně. Naopak z jných zdrojů je čtenář jstě známo, že př měření (č jných technkách zjšťování údajů) nutně vznkají chyby. Náhodné chyby kupodvu vykazují určté zákontost. Nejnápadnější z nch je tendence kompenzovat se ve velkých datových souborech. Zákontost náhodných chyb jsou s použtím statstckých metod dobře popsatelné (např. lze odhadnout jejch možnou velkost), ale problematkou teore chyb se zabývat nebudeme. Systematcké chyby vznkají soustavným působením určtého čntele po celou dobu zjšťování. Jsou obtížně zjsttelné a pochoptelně u nch nelze hovořt o tendenc ke kompenzac s rostoucím počtem pozorování. Hrubé chyby vznkají v důsledku určtého momentálního selhání a pokud jsou to např. odlehlé hodnoty, dají se dentfkovat př uspořádání zjštěných hodnot podle velkost. Výběrová chyba vznká v důsledku ztráty nformace př výběrovém způsobu zjšťování, kdy populace je zastoupena výběrem. Vzhledem k tomu, že z populace lze zpravdla pořídt obrovský počet různých výběrů, lší se výsledky jejch popsu vzájemně mez sebou a také od výsledků, které bychom získal z celé populace (pokud by to bylo možné). Výběrové chyby jsou s použtím statstckých metod velm dobře popsatelné a ve své podstatě jde rovněž o náhodné chyby. 2

Nevýběrová chyba vznká sce př výběrovém způsobu zjšťování, ale je způsobena porušením pravdel hry, např. oslovením jné než původně náhodně vybrané domácnost, neprovedením zjšťování v hůře dostupné a řídce osídlené část regonu a nahrazením tohoto nedostatku svévolným rozšířením šetření v dostupnější část (např. velkém městě) apod. Chybějící hodnoty když nejde v pravém slova smyslu o chyby v datech, musíme počítat s tím, že někdy se nepodaří dohledat všechny údaje a jejch část chybí. Na tuto skutečnost v prax reagujeme různým metodam ošetření chybějících hodnot. Touto problematkou se ovšem nebudeme zabývat. Σ. Podle podmínek lze statstcká zjšťování klasfkovat na řízené expermenty a prostá pozorování. V našem případě je ovšem význam řízených expermentů jen okrajový. 2. Podle úplnost zjšťování lze statstcká zjšťování klasfkovat na úplná a neúplná. V našem případě je ovšem výskyt úplných zjšťování spíše sporadcký. 3. U neúplných zjšťování je rozhodujícím hledskem reprezentatvnost získaného vzorku. 4. Pokud zjšťování vede k reprezentatvnímu vzorku, hovoří se o výběrovém zjšťování. 5. Základní metodou výběrových zjšťování je pravděpodobnostní výběr a jeho nejjednodušším uspořádáním je prostý náhodný výběr. 6. Rozlšujeme popsnou statstku, pomocí níž provádíme deskrpc dat a matematckou statstku, kterou užíváme k zobecňování nformací získaných z výběrových souborů směrem k populac. 7. Vlastnost, které jsou předmětem šetření, se nazývají znaky. 8. Znaky klasfkujeme např. na kardnální, ordnální a nomnální. 9. Statstcké údaje mají buď průřezový charakter nebo tvoří časovou řadu. 0. Po celou dobu výkladu nás budou doprovázet statstcké tabulky a grafy. Tato lekce obsahuje základní nformace o nch.. Statstcké zjšťování je spojeno s výskytem chyb. Chyby klasfkujeme na náhodné, systematcké a hrubé. S výběrovým způsobem zjšťování jsou spojeny výběrová a nevýběrová chyba. (.) Sčítání obyvatel se řídí zákonem a je pokusem o úplné zjšťování; exstuje zákonná povnnost evdovat dopravní nehody s určtým parametry (výše škody, zranění nebo usmrcení osob apod.). Ve všech ostatních případech lze provádět pouze reprezentatvní nebo nereprezentatvní neúplné zjšťování (.2) Čísla v losovacím zařízení představují populac. Tažená šestce představuje náhodný výběr. Jde o prostý náhodný výběr bez opakování a znáhodňovací technkou je losování. 3

. Charakterzujte pojmy hromadnost a varablta. 2. Jaké jsou výhody a nevýhody prostého pozorování? 3. Jaké jsou výhody a nevýhody neúplných zjšťování? 4. Vysvětlete postup př pravděpodobnostním výběru. 5. Defnujte prostý náhodný výběr. 6. Zařaďte anketu z hledska reprezentatvnost získaného vzorku. 7. Exstuje (aspoň teoretcky) možnost, že rozsah výběru přesáhne rozsah populace? 8. Co je opakem deskrpce ve statstce? 9. Porovnejte obsah pojmů základní soubor, výběrový soubor, datový soubor. 0. S kterým statstckým znakem je spojen výraz hodnota/obměna.. O jakou nformac přcházíme, nahradíme-l naměřené hodnoty jejch pořadím? 2. Pokuste se vytvořt co nejpodrobnější schéma klasfkace statstckých znaků. 3. Které smluvené značky používáme ve statstckých tabulkách a jaký mají význam? 4. Jaké druhy grafckých prostředků společně vytvářejí grafcký obraz? 5. Co rozumíme pod pojmy obchodní grafy, pktogramy, kartogramy, kartodagramy? 6. Tvrdím, že rovněž výběrové chyby mají tendenc s rostoucím počtem případů (tedy výběrů) se kompenzovat. Mám pravdu? 7. Co rozumíme pod pojmem nevýběrová chyba? 4

Lekce 2 Třídění a významné hodnoty Ponechme nyní poněkud stranou různorodé poznatky první lekce týkající se zjšťování a typů dat a omezme se jen na nejjednodušší případ datových souborů tvořených hodnotam kardnálních znaků. Datovou řadu (datový vektor) jsme v první lekc označl x, x2,..., x,..., xn, kde ndex souvsí s pořadím zjšťování a datový soubor je tudíž neuspořádaný. Rozumným krokem je uspořádání datového vektoru (vzestupně nebo sestupně). Označme nyní x ( ), x(2),..., x( ),..., x( n) vzestupně uspořádaný datový vektor, pro jehož prvky platí x( ) x(2)... x( )... x( n) a kde je tedy x( ) = xmn, x( n ) = xmax (nejmenší a největší hodnota). Vektor hodnot x [ ], x[2],..., x[ ],..., x[ k ], pro který x [ ] < x[2] <... < x[ ] <... < x[ k ], přčemž n >> k, se nazývá vektor varant. Základní metodou zpracování dat je jejch třídění. Pokud lze v datovém souboru nalézt vektor varant (bez ohledu na rozsah souboru se v něm systematcky opakuje jen několk málo hodnot), vede to k bodovému (též prostému) třídění. V opačném případě jde o náročnější případ ntervalového třídění. Některé hodnoty uspořádaného datového souboru se vyznačují zvláštní polohou nebo jnou vlastností, jíž stojí za to s povšmnout. Ty se nazývají významné hodnoty. Ve druhé lekc se tedy budeme zabývat zásadam bodového a ntervalového třídění a tabulkovou a grafckou prezentací jeho výsledků. Nejdůležtějším pojmem této lekce je pojem rozdělení četností. Vedle toho se budeme rovněž věnovat významným hodnotám datové řady. Celá tato lekce se vztahuje k problematce zpracování dat. absolutní četnost; bodové třídění; četnost; četnostní funkce; četnostní hustota; decl; funkce četnostní hustoty; extrémní hodnota; hstogram; kumulatvní četnost; kvantl; kvartl; modus; oktl; percentl; p kvantl; relatvní četnost; rozdělení četností; sedecl; spojncový graf; střed ntervalu; stupňový graf; šířka ntervalu; úsečkový graf; třídcí nterval; typcká hodnota; varanta znaku 2. Bodové třídění Př bodovém třídění stačí nalézt vektor varant x [ ], x[2],..., x[ ],..., x[ k ] a pro každou varantu zjstt počet jejích výskytů četnost (také absolutní četnost). Četnost té varanty označíme n. Je k zřejmé, že n = n (kde n je rozsah souboru). = Rozdělení četností př bodovém třídění s můžeme představt jako dvousloupcovou tabulku, jejíž první sloupec tvoří prvky vektoru varant a druhý sloupec prvky vektoru četností (vz tab. 2. v následujícím příkladu 2.). Rovnocennou prezentací rozdělení četností př bodovém třídění je grafcké vyjádření pomocí úsečkového (hůlkového) grafu v pravoúhlé souřadncové soustavě (vz. obr. 2.). Vedle absolutních četností využíváme př prezentac rozdělení četností také 5

relatvní četnost, kde pro -tou varantu je její relatvní četnost být vyjadřovány také v %; pak se pracuje s hodnotam analogcky 00 %), p = k 00 p, přčemž = n ; tyto četnost mohou n p = (pro 00 p kumulatvní četnost (opět absolutníkn nebo relatvníkp ) vznkají kumulací (postupným načítáním) absolutních nebo relatvních četností postupně za jednotlvé varanty, např. kn = n j. Rovněž pro tyto četnost exstují adekvátní způsoby jejch grafckého vyjádření, které jsou patrné z řešeného příkladu 2.. Pro Příklad 2. zadání příkladu 2. vytvořte vzestupně uspořádaný datový vektor a nalezněte vektor varant. Zadání úlohy spočívá v tom, že u celkového počtu 25 domácností určté socální skupny byl zaznamenán počet dětí. Neuspořádaný datový vektor x : 4,3,2,2,4,0,,4,3,3,3,3,0,,,2,,2,,3,3,2,3,4,2 Bodové třídění údajů o počtu dětí v souboru n = 25 domácností. Tab. 2. Počet dětí x [ ] 0 2 3 4 Tabulka rozdělení četností počtu dětí Absolutní četnost n 2 5 6 8 4 Relatvní četnost (v %) 00 p 8,0 20,0 24,0 32,0 6,0 Kumulatvní četnost absolutní kn 2 7 3 2 25 relatvní kp 0,08 0,28 0,52 0,84,00 Součet 25 00,0 Symbolem jsme v políčku součtového řádku označl, že sčítat kumulatvní četnost je nesmyslné. Obr. 2. Graf rozdělení četností (a) absolutních, (b) relatvních kumulatvních j= Počet dětí v domácnost Počet dětí v domácnost V prvním případě jde o úsečkový (hůlkový) graf. Ve druhém případě jsme relatvní kumulatvní četnost znázornl pomocí spojncového stupňového grafu. 6

Představte k x n Co udává součet součnů? Ve statstce s často klademe otázku, zda zjštěná hodnota je = pouze přblžná (odhadnutá) nebo zda jde o přesnou hodnotu. Jak je tomu v tomto případě? (2 ) s, že vedle příkladu 2. exstuje analogcký příklad, ovšem pro 2500 domácností, kde se opět vyskytují stejné varanty jako v př. 2.. Jakým způsobem zajstíme srovnatelnost výsledků třídění (porovnání jak se četností rozdělly mez jednotlvé varanty). (2 2) 2.2 Intervalové třídění U některých znaků nemá smysl určovat vektor varant, neboť počet varant může být (v krajním případě) roven rozsahu souboru n. V tomto případě se provádí rozdělení datového souboru do třídcích ntervalů a hovoří se o ntervalovém třídění. Zásady ntervalového třídění můžeme stručně shrnout takto: přměřený počet k třídcích ntervalů (např. orentačně k + 3,3 log n ), jejch nesporné vymezení (nesmí se an překrývat, an nedokrývat ), konstantní šířka ntervalu h (pokud to data dovolují), možnost otevřených krajních ntervalů (pro zařazení extrémních hodnot), jejchž šířka se také pro jednoduchost považuje za rovnu h. Vyberte vhodné vymezení třídcích ntervalů. Význam závorek je stejný jako př označování ntervalů na číselné ose. Přhlédněte přtom k druhé zásadě ntervalového třídění. Například: 00 (b) 00 ; 200, 200; 300,..., 600; 700 (a) ( ; 200),( 200; 300),...,( 600; 700) 00 (d) ( 00 ; 200 ;( 200; 300,...,( 600; 700 (c) ; 200), 200; 300),..., 600; 700) Př ntervalovém třídění je vektor varant nahrazen vektorem středů ntervalů (opět x ). Rozdělení četností př ntervalovém třídění je dvousloupcová tabulka, jejíž první sloupec tvoří středy ntervalů a druhý sloupec prvky vektoru četností (vz tab. 2.2 v následujícím příkladu 2.2). Rovnocennou možností je prezentovat rozdělení četností př ntervalovém třídění grafcky pomocí sloupcového grafu (hstogramu) v pravoúhlé souřadncové soustavě. Př ntervalovém třídění se využívají rovněž relatvní četnost kumulatvní četnost Příklad 2.2 kn, kp. O nch v odstavc 2.. p a také absolutní a relatvní Intervalové třídění údajů o počtu obyvatel v n = 87 venkovských obcích jednoho regonu. Výsledek třídění je obsažen v tabulce 2.2. Třídění jsme provedl do k = 6 ntervalů o konstantní šířce h = 300. První a poslední nterval jsme koncpoval jako otevřené, ale jejch šířku považujeme za rovnu h. Součet relatvních četností může vykázat zaokrouhlovací chybu. Nevyužtá políčka součtového řádku jsme opět označl symbolem, aby bylo zřejmé, že hodnoty příslušného sloupce nechceme sčítat. 7

Tab. 2.2 Vymezení třídcího ntervalu 200> (200;500> (500;800> (800;00> (00;400> (400+ Tabulka rozdělení četností počtu obyvatel venkovských obcí Střed třídcího Absolutní Relatvní ntervalu četnost absolutní x n 50 350 650 950 250 550 24 27 9 0 4 3 četnost (v %) 00 p 27,6 3,0 2,8,5 4,6 3,4 Kumulatvní četnost kn 24 5 70 80 84 87 relatvní kp 0,276 0,586 0,805 0,920 0,966,000 Součet 87 99,9 Šířku prvního a posledního ntervalu položíme rovněž h = 300. Obr. 2.2 Graf rozdělení četností (a) absolutních, (b) relatvních kumulatvních 50 350 650 950 250 550 Středy tříd pro počet obyvatel obce 200 500 800 00 400 700 Horní hrance tříd pro počet obyvatel obce V prvním případě jde o sloupcový graf se slepeným sloupc hstogram. Ve druhém případě jsme relatvní kumulatvní četnost znázornl pomocí spojncového grafu (lomená čára, často s typckým esovtým průběhem). Kumulatvní četnost se vynášejí prot horním hrancím ntervalů. Postačí k x n Co udává součet součnů? Ve statstce s často klademe otázku, zda zjštěná hodnota je = pouze přblžná (odhadnutá) nebo zda jde o přesnou hodnotu. Jak je tomu v tomto případě? (2 3) v případě ntervalového třídění relatvní četnost pro zajštění srovnatelnost výsledků třídění? Odhadněte, co by se stalo, pokud bychom obce podle počtu obyvatel třídl jemněj, např. do 8 ntervalů o šířce 00 obyvatel? (2 4) p Hustota četností je funkce f =, tj. relatvní četnost, přpadající na jednotku třídcího h ntervalu. Na rozdíl od relatvní četnost nezávsí na šířce ntervalu h, tj. na jemnost třídění, a zachovává s (přblžně) svůj průběh př třídění do stále většího počtu užších ntervalů. Lze s představt, že př extrémně jemném třídění přechází lomená čára znázorňující průběh relatvních kumulatvních četností v hladkou křvku a podobně hladkou čarou se obaluje hstogram hustoty četností. 8

Chápeme-l relatvní četnost př bodovém třídění a hustotu četností př ntervalovém třídění jako funkc hodnot znaku, dospíváme k pojmu četnostní funkce p(x) a funkce četnostní hustoty f(x). Četnostní funkce je nezáporná a normovaná 0 p( x), p( x) =. Četnostní hustota je nezáporná f (x) 0 a normovaná f ( x) dx = (plocha hstogramu četnostní hustoty je vždy rovna jedné). + x 2.3 Významné hodnoty V datové řadě je vhodné povšmnout s některých hodnot, které v ní mají určté zvláštní postavení. Mez tyto významné hodnoty patří Extrémní hodnoty v uspořádané řadě hodnoty x( ) = xmn ; x( n ) = xmax, tj. mnmální a maxmální hodnota. Vzdálenost těchto hodnot se nazývá varační rozpětí a označuje se symbolem R. Problémem extrémních hodnot může být to, že jedna nebo obě mohou být hrubým chybam. Typcká hodnota také modální hodnota (modus) představuje nejčastěj se vyskytující hodnotu (u netříděných dat a dat tříděných bodovým tříděním), u ntervalového třídění za n můžeme považovat střed ntervalu s nejvyšší četností. My však budeme používat přesnější aproxmac, která přhlíží k četnostem sousedících ntervalů. Modální hodnota znaku X se označuje xˆ (x se stříškou). Kvantly tvoří celou soustavu významných hodnot, u nchž s všímáme jejch polohy v uspořádané řadě hodnot. Hlavním kvantlem je tzv. medán, který rozděluje uspořádanou datovou řadu na dvě část se stejnou četností. Medán spolu s dalším dvěma kvartly (dolním a horním kvartlem) rozděluje datovou řadu na čtyř část se stejnou četností. Podobně devět declů nebo 99 percentlů rozděluje uspořádanou řadu na deset/sto částí o stejné četnost. Půlením četností mez kvartly naopak vznká řada alternatvních kvantlů, a to nejprve 7 oktlů, po nchž následuje 6 sedeclů. Příklad 2.3 Určíme medán v řadě netříděných hodnot. Datový soubor pro n = 8 x : 45,, 3,4, 2,0, 2, 3. Datový soubor pro n = 7 x : 45,, 3, 4, 2,0, 3 Uspořádaný datový soubor pro n = 8 x : 3, 0, 4,,3, 2, 2, 45 ( ) n Pořadové číslo medánu v uspořádaném datovém souboru je + 0,5 = 4, 5. Hodnota s (hypotetckým) 2 + 3 pořadím 4,5 leží mez 4. a 5. hodnotou a určíme j jako průměr x 0,50 = = 2 2 Uspořádaný datový soubor pro n = 7 x : 3,0, 4,,3, 2, 45 ( ) n + 0,5 = 4 a medánem je tudíž přímo hodnota x 0,50 =. 2 Obecně hovoříme o P kvantlu (pro 0 < P < ), který je takovou hodnotou x P, pro kterou je relatvní četnost hodnot nejvýše rovných x p rovna P, zatímco relatvní četnost hodnot větších nebo rovných x P je rovna P. Jsou-l data tříděna bodovým tříděním, je P kvantlem ta varanta, u které poprvé kumulatvní relatvní četnost překračuje hodnotu P. U ntervalového třídění je odhadem P kvantlu střed ntervalu, u kterého opět poprvé kumulatvní relatvní četnost překračuje hodnotu P. Tento odhad lze rovněž zpřesnt, pokud předpokládáme, že kumulatvní četnost uvntř ntervalu roste 9

lneárně. Někdy se místo o P kvantlu hovoří o 00P % kvantlu (např. medán je tedy 50% kvantlem). Zcela obecně, 00P% kvantlem je hodnota x (), pro kterou je splněno 00P 00a a současně 00 00P 00b, kde a n j = 00, = pro =,2,..., n, j = 0,,2,..., n. Potřebné údaje pro náš příklad pro n = 7 b n uvádí tabulka. Příklad 2.4 Určíme např. 33% kvantl z netříděných dat pro n = 7 (příklad 2.3). Tab. 2.4 Určení kvantlů z netříděných dat x 45 3 4 2 0 3 x 3 0 4 3 2 45 () 00 a 00 7 n = 4,29 28,57 42,86 57,4 7,43 85,7 00,00 ( 3) = 00 b 7 6 00,00 85,7 7,43 57,4 42,86 28,57 00 = 4,29 7 Pomocí údajů v tabulce nalezneme 33% kvantl. Pro třetí hodnotu podle velkost x 4 jako jednou je splněno 33 42, 86 a současně 00 33 = 67 7, 43. Hodnota 4 je tedy 33% kvantlem. Je ovšem např. 39% kvantlem, neboť 39 42, 86 a současně 00 39 = 6 7, 43. Upozorňujeme ovšem opět na to, že defnc kvantlu mohou vyhovět dvě za sebou jdoucí hodnoty. Využjte tabulky 2.4 a určete 60%, 70% a 90% kvantl. (2 5) Příklad 2.5 Určíme významné hodnoty pro příklad 2. (domácnost tříděné bodovým tříděním podle počtu dětí). V tabulce 2. snadno najdeme obě extrémní hodnoty (0 a 4 dět). Varanta s nejvyšší četností x ˆ = 3 (nejčastější výskyt zaznamenaly domácnost se třem dětm). Medánová (prostřední) varanta počtu dětí je rovna x 2 (u této varanty kumulatvní relatvní četnost poprvé překročla hodnotu 0,50). 0,50 = Všechny tyto hodnoty jsou určené přesně. Stejné hodnoty bychom obdržel z netříděných dat. U příkladu 2. určete dolní kvartl x 0, 25 a horní oktl x 0, 9375. Insprujte se příkladem 2.5. Úsporným a přehledným nástrojem pro zobrazení hlavních vlastností dat jsou tzv. krabcové grafy. Ukázku těchto grafů vz na obr. 2.3 v příkladu 2.6. Příklad 2.6 Krabcovým grafy znázorníme datové soubory x : 20, 0, 3, 20, 332,, 9, 52,, 7, 4, 0, 2, 23 pro n = 3, y : 0,, 2, 0, 5, 5, 5, 4, 7, 3, 7, 0, 9, 56,, 0, 0, 4, 32,, pro n = 2. 20

Obr. 2.3 Krabcové grafy n = 3 Odlehlé pozorování n = 2 0 5 0 5 20 25 30 35 0 5 0 5 20 25 30 35 Výška krabce koresponduje s rozsahem souboru. Levá strana krabce představuje dolní kvartl, pravá horní kvartl. Příčka uvntř krabce je medán. Vlákna označují hrance hodnot, které nejsou detekovány jako odlehlé. 2.4 Aproxmace typcké hodnoty a kvantlů u ntervalového třídění Polohu modu lze v tomto případě určt s použtím vztahu nm nm xˆ = dm + h, n n n 2 m m m+ kde d m je dolní mez modálního ntervalu, n m, nm, nm+ jsou postupně četnost modálního, předchozího a následujícího ntervalu a h je šířka ntervalu. 00P 00kpq Polohu kvantlů uvntř ntervalu upřesníme podle vzorce xp = d q + h, 00p kde pro lbovolné P jsou q q d, p postupně dolní mez a relatvní četnost ntervalu (q tého) obsahujícího příslušný kvantl, kp q je součtová relatvní četnost předchozího ntervalu a h je šířka ntervalu. Příklad 2.7 Pomocí právě uvedených vzorců odhadneme polohu typcké hodnoty a medánu pro obce tříděné podle počtu obyvatel (příklad 2.2). Údaje budeme čerpat z tabulky 2.2. Typcká hodnota leží ve druhém ntervalu a její hrubou aproxmací je jeho střed (350 obyvatel). Tuto 3 hodnotu zkorgujeme x ˆ = 200 + 300 = 282. Vzhledem k tomu, že více je obsazen první nterval, 3 + 8 je typcká hodnota posunuta vlevo od středu ntervalu. Medán leží rovněž ve druhém ntervalu. Za předpokladu, že by hodnoty uvntř ntervalu byly rozděleny rovnoměrně, je medán x 50 27,6 0,50 = 200 + 300 = 47. 3 Určete horní kvartl pro příklad 2.2. (2 6) q 2

Σ. Základní metodou zpracování dat ve statstce je metoda třídění. 2. Podle typu dat se používá buď bodové nebo ntervalové třídění. 3. Výsledkem třídění je rozdělení četností. 4. Rozdělení četností lze vyjádřt v tabulkové nebo grafcké podobě. 5. Rozdělení četností př bodovém třídění tvoří vektor varant a vektor četností. 6. Rozdělení četností př ntervalovém třídění tvoří vektor středů ntervalů a vektor četností. 7. Vedle absolutních četností se používají četnost relatvní a rovněž absolutní a relatvní kumulatvní četnost. 8. Formálně se u bodového třídění zavádí četnostní funkce a u ntervalového třídění funkce četnostní hustoty. 9. V datovém souboru lze najít významné hodnoty extrémní hodnoty, typckou hodnotu (modus) a kvantly. 0. Soustava kvantlů obsahuje především medán, kvartly, decly a percently. Alternatvně pak po kvartlech následují oktly a sedecly.. Všechy významné hodnoty lze určt zcela přesně pro netříděná data a data tříděná bodovým tříděním. 2. U ntervalového rozdělení četností je možno aproxmovat polohu typcké hodnoty a kvantlů uvntř příslušných tříd. (2 ) Uvedený výraz představuje úhrn (součet) hodnot znaku datového souboru tříděného bodovým tříděním. Jde o přesnou hodnotu. (2 2) K zajštění srovnatelnost obou rozdělení četností postačí použít relatvní četnost. (2 3) U ntervalového třídění jde rovněž o úhrn (součet) hodnot znaku. Na rozdíl od bodového třídění jde jen o odhadovanou hodnotu (střed ntervalu reprezentuje hodnoty ležící uvntř ntervalu nedokonale). (2 4) Se zvyšující se jemností třídění (větší počet užších ntervalů) klesají absolutní relatvní četnost. Srovnatelnost rozdělení četností př ntervalovém třídění zabezpečuje hustota četností. (2 5) x = x = ; x 45. 0,60 0,70 3 0, 90 = (2 6) x 726. 0,75 =. Zpracujte po vzoru příkladu 2. bodové třídění výsledků nejméně 30 hodů hrací kostkou, které sam provedete. Určete relatvní a kumulatvní četnost. Sestavte tabulku rozdělení četností a proveďte grafcké znázornění po vzoru obr. 2.. 2. Zpracujte po vzoru příkladu 2.2 ntervalové třídění fktvního datového souboru, jehož zadání obdržíte. Třídění proveďte alternatvně do šest a do 2 ntervalů. Porovnejte grafy absolutních a relatvních četností a grafy hustot četností obou varant. 3. Jaké hodnoty nabývá, případně jaký má smysl, součet absolutních četností, relatvních četností a kumulatvních četností? 4. Co je hstogram a jaké je jeho použtí? 22

5. Graf které četnost a př jakém třídění má stupňovtý průběh? 6. Objasněte pojem varační rozpětí. 7. Určete kvartly pro datový soubor x : 45,, 3, 4, 2,0, 2,3, 0. 8. Určete kvartly u příkladu v zadání. 9. Určete kvartly u příkladu 2. Nejprve zkuste vyhledat přesné hodnoty kvartlů v netříděných datech. Pak porovnejte tyto přesné hodnoty s odhady, které získáte př třídění dat do šest ntervalů. 0. Jak se nazývají kvantly, které rozdělují uspořádaný datový soubor na čtyř, osm, deset, šestnáct a sto částí o stejné četnost a jaký je jejch počet?. Jak jnak (společně) můžeme pojmenovat vždy prostřední ze všech těchto kvantlů? 23

Lekce 3 Měření koncentrace Pod pojmem koncentrace rozumíme jak rovnoměrně, č spíše jak nerovnoměrně, jsou hodnoty znaku rozprostřeny mez jednotlvé prvky datového souboru. Nulová koncentrace odpovídá stavu, kdy všechny hodnoty datového souboru jsou stejné. V opačném případě jde o větší nebo menší koncentrac, kterou můžeme vyjádřt charakterstkam koncentrace koncentrační křvkou, medálem a Gnovým ndexem. Podmínkou pro měření koncentrace je, aby znak byl sčtatelný. Pokud tomu tak není, je třeba ho na sčtatelný znak převést. Např. počet obyvatel na jednotku plochy (hustota) je nesčtatelná, kdežto každá z obou velčn, které hustotu tvoří (počet obyvatel, plocha), sčtatelná je. Koncentrac můžeme měřt jak pro netříděná data, tak pro data tříděná bodovým nebo ntervalovým tříděním. koncentrace; koncentrační křvka; Lorenzova křvka; medál; relatvní kumulatvní četnost; relatvní kumulatvní úhrn hodnot znaku; sčtatelný znak 3. Pojem koncentrace Povšmněme s nyní zvláště rozdělení četností tzv. sčtatelných znaků, tj. znaků, u nchž má smysl součet (úhrn) hodnot znaku za část jednotek souboru, případně za soubor jako celek. U takovýchto znaků, jak jsme se jž dříve zmínl, reprezentuje u ntervalového třídění součn x n odhad k ntervalového úhrnu a součet těchto součnů x n je odhadem úhrnu hodnot znaku za celý soubor, = zatímco u prostého třídění jde vesměs o přesné hodnoty. Vytvořme nyní kumulatvní, v % vyjádřenou j= velčnu 00kq = k 00 pro, j =, 2,..., k. Tato velčna reprezentuje podíl úhrnu prvních x n = x j n j ntervalů na úhrnu hodnot znaku celého souboru. U sčtatelných znaků má smysl tuto velčnu zkoumat ve vztahu ke kumulatvní relatvní četnost 00kp = k 00. n Právě vzájemné porovnání průběhu obou těchto velčn (např. v grafu) se nazývá měření koncentrace datového souboru. Zvažte, ve kterých případech lze měřt koncentrac: soubor respondentů podle vzdělání, soubor domácností podle příjmů, soubor pozemků podle hektarového výnosu plodny, soubor výrobků podle zskové marže (zsk/tržby). Pokuste se o zdůvodnění. 3.2 Koncentrační křvka Pokud do grafu, na jehož osách jsou velčny 00 kq, 00kp, vyneseme vypočtené hodnoty, které spojíme lomenou čarou, eventuálně hladkou křvkou, získáme koncentrační Lorenzovu křvku. Tato křvka vypovídá o rovnoměrnost (resp. nerovnoměrnost) rozdělení úhrnu hodnot znaku mez jednotlvé ntervaly (varanty znaku u bodového třídění nebo v případě netříděných dat mez jednotlvé j= = n j 24

případy). Pokud by byly všechny hodnoty znaku v souboru konstantní, hodnoty v obou vyznačených sloupcích tabulky by se rovnaly a Lorenzova křvka by odpovídala na grafu vyznačené úhlopříčce. Na obr. 3. jsou příklady koncentračních křvek (znázorněných prostřednctvím lomených čar) pro různý charakter osídlení regonu. Pokud by hustota osídlení byla na celé ploše konstantní, byla by koncentrační křvkou úhlopříčka obrázku. S rostoucí nerovnoměrností osídlení roste zakřvení koncentrační křvky (vz obrázek 3.). Obr. 3. Koncentrační křvky př různé rovnoměrnost osídlení regonu Kumulatvně (v %) vyjádřený podíl na počtu obyvatel Kumulatvně (v %) vyjádřený podíl na území regonu Z obrázku např. vyplývá, že v regonu s nejméně rovnoměrným osídlením na 0 % území regonu žje 40 % jeho obyvatel, zatímco zbývajících 60 % obyvatel má k dspozc 90 % rozlohy. Ve druhém reálném případě na 20 % území regonu žje 30 % obyvatel. V deálním případě zcela rovnoměrného osídlení by určté procento obyvatel žlo na část výměry vyjádřené stejnou hodnotou (vz tečkovaná úhlopříčka obrázku). 3.3 Medál U sčtatelných znaků je medál hodnota znaku, která půlí úhrn hodnot znaku souboru na dvě stejné část. Čím více je hodnota medálu vzdálena od hodnoty medánu, tím větší je nerovnoměrnost rozdělení celkového úhrnu hodnot znaku mez jednotlvé případy a tím větší je nepoměr mez počtem jednotek, které se dělí o každou z jeho polovn. Obr. 3.2 Poloha medálu Kumulatvně (v %) vyjádřený podíl na počtu obyvatel Kumulatvně (v %) vyjádřený podíl na území regonu Na našem příkladu vdíme současně, že zatímco 50 % rozlohy regonu obývá as 90 % jeho populace, tak naopak 50 % populace se musí spokojt s necelým 20 % jeho území. 25

Způsob určení medálu se podobá určení medánu. Vzorec medálu kde M je označení pro medálový nterval. x M = d M 50 00kqM + xm nm 00 k x n = h, Příklad 3. Určíme medálovou obec, tj. velkost obce, v níž by př uspořádání obcí podle velkost žl prostřední obyvatel z celkového počtu. Použjeme data z příkladu 2.2. Tab. 3. Pomocná tabulka pro určení medálu Střed třídcího Absolutní x jn j ntervalu četnost x n j= x n 00 k x n 50 350 650 950 250 550 24 27 9 0 4 3 200 9450 2350 9500 5000 4650 = 2,85 25,27 54,57 77, 88,97 00,00 Kumulatvní relatvní četnost (v %) 00 p 27,6 58,6 80,4 9,9 96,5 99,9 87 4250 Takže např. odhadujeme, že ve třetí velkostní skupně obcí (500; 800> žje 2350 obyvatel, zatímco ve 200 + 9450 + 2350 všech 87 obcích je to 4250 obyvatel. Pro třetí velkostní skupnu obcí je 00 4250 50 25,27 = 54,57 %. Medál x M = 500 + 300 = 753 ukazuje, že prostřední z celkového počtu 2350 00 4250 obyvatel žje ve (fktvní) obc se 753 obyvatel. Všmněte s, že medál nabyl vyšší hodnoty než medán ( x 47; x 753 ). Není to náhoda, je tomu tak vždy, když data jsou varablní (v souboru se 0,50 = M = vyskytují různě velké obce). S využtím posledních dvou sloupců tabulky 3. sestrojte koncentrační křvku (postačí lomená čára) pro příklad o počtu obyvatel obcí 2.2. Kumulatvní četnost (pro určení medánu nebyly potřeba) vyneste na svslou osu. Křvka vychází z počátku. 3.3 Gnův ndex Hodnott míru zakřvení koncentrační křvky (v našem případě lomené čáry) není jednoduché. Proto se jako ukazatel koncentrace využívá Gnův ndex, který vyjadřuje, jakou část plochy trojúhelníku obrazce pokrývá plocha pod koncentrační křvkou. Je zřejmé, že Gnův ndex je bezrozměrné (eventuálně v % vyjádřené) číslo, kde 0 G <. Konečně, an určení této plochy není trvální záležtostí a k výpočtu ndexu se využívá řada aproxmací, které ovšem nebudeme uvádět. 26

Obr. 3.3 Prncp Gnova ndexu Kumulatvně (v %) vyjádřený podíl na počtu obyvatel Plocha trojúhelníku Plocha pod křvkou Kumulatvně (v %) vyjádřený podíl na území regonu Σ.. Pro datové soubory sčtatelných číselných znaků má smysl zkoumat jejch koncentrac. 2. Koncentrac lze měřt u netříděných dat, stejně jako u dat tříděných bodovým nebo ntervalovým tříděním. 3. Charakterstkam souvsejícím s koncentrací jsou koncentrační křvka, medál a Gnův ndex. 4. Nejnžší míru koncentrace vykazují data, jejchž všechny hodnoty jsou konstantní. Na opačném pólu jsou data tvořená jak extrémně vysokým, tak nízkým hodnotam. 5. Měření koncentrace má význam jak v hospodářské oblast (koncentrace společenského bohatství, monopolzace odvětví), tak v oblast demografcké a geografcké (např. koncentrace obyvatelstva). Určete charakterstky koncentrace (ty které znáte) pro příklad z lekce o třídění. 2. Určete charakterstky koncentrace (ty které znáte) pro příklad 2 z lekce o třídění. 3. V regonu působí v určtém odvětví 5 frem. Výše jejch produkce, vyjádřená v ročních tržbách je 3, 7, 5, 2 a 43 ml. Kč. Sestrojte pro tento případ koncentrační křvku. Ve které frmě je realzována prostřední koruna tržeb? Lekce. 6. Najděte odpověď v textu lekce. 7. U výběru s opakováním může (alespoň teoretcky) počet tahů n převýšt rozsah populace N. 7.. Najděte odpověď v textu lekce. 2. Znaky klasfkujte na číselné a slovní. Číselné pak na kardnální a ordnální. Kardnální znaky na ntervalové a poměrové. Slovní znaky klasfkujte na alternatvní a množné. 3. 5. Najděte odpověď v textu lekce. 6. Ano. 7. Najděte odpověď v textu lekce. 27

Lekce 2. 2. Výsledky jsou ndvduální (podle zadání). 3. Rozsah souboru, jedna (00 %), součet kumulatvních četností nemá smysl. 4. 5. Odpověd vyplývají přímo z textu lekce. R = x max x. 6. mn 7. Prostudujete-l s příklad 2.4, získáte x = ; x = ; x 2. 0,25 0 0,50 0, 75 = 8. 9. Výsledky jsou ndvduální (podle zadání). 0. Tř kvartly, sedm oktlů, devět declů, 5 sedeclů, 99 percentlů.. Vždycky jde o medán. Lekce 3. 2. Výsledky příkladů jsou ndvduální. 3. Křvku vytvořte z hodnot 00 kp 0 20 40 60 80 00 00 kq 0 2,86 7,4 7,4 38,57 00,00 Prostřední koruna tržeb je tedy realzována ve frmě s největším tržbam. Tento úvodní modul se ve třech lekcích věnoval zjšťování dat v nejrůznějších stuacích, jejch zpracování (zejména třídění), měření koncentrace datového souboru. Po jeho prostudování by měl mít čtenář základní představu o pořzování dat př nejrůznějších statstckých šetřeních. Měl by rozlšovat řízený experment a prostá pozorování, úplná a neúplná zjšťování. Měl by vědět, že nejspolehlvějším způsobem získání reprezentatvního vzorku je pravděpodobnostní výběr. Měl by mít představu o základních druzích statstckých znaků, se kterým se může v prax setkat. Měl by vědět, že neexstují bezchybná data. Měl by praktcky zvládnout případ bodového a ntervalového třídění, sestavt tabulku rozdělení četností a zvládat grafcké znázornění rozdělení četností. Měl by vědět, které jsou významné hodnoty datového souboru a umět je určt z netříděných dat, dat tříděných bodovým tříděním a přblžně z dat tříděných ntervalovým tříděním. Získat představu o koncentrac jako vlastnost datového souboru, která vypovídá o rovnoměrnost č nerovnoměrnost rozdělení hodnot znaku mez jednotlvé případy. Umět se sestrojt a nterpretovat koncentrační křvku pro tříděná netříděná data. Stanovt medál datového souboru a dokázat ho smysluplně nterpretovat. Získat rámcovou představu o způsobu konstrukce Gnova ndexu (bez konkrétního výpočtu). V dalším studu lze pokračovat modulem 2 Pops datového souboru prostřednctvím charakterstk 28

Dodatek Použtí MS Excel pro tvorbu grafů Doporučujeme používat průvodce tvorbou grafu. Rozdělení četností 50 40 Absolutní 30 četnost 20 0 0 00 200 300 400 500 600 700 Středy ntervalů Algortmus: Vložt data Vybrat nabídku Vložt Graf Zobrazí se dalogové okno Průvodce grafem Vybereme typ grafu, defnujeme datové řady, zvolíme název grafu, popsky os, umístění grafu (průvodce krok až 4). Po vložení grafu můžeme graf dále lbovolně upravovat (vz například dalogové okno vlevo). Pro každý prvek grafu je umožněno otevřít dalogové okno pro jeho úpravy. My jsme např. v našem grafu upravl barvu sloupců a zrušl mezery mez nm. Možných je několk desítek typů grafů, počet jejch možných varant a úprav nelze dost dobře vyčíslt. 29