APLIKOVANÁ STATISTIKA pro FRRMS

Rozměr: px
Začít zobrazení ze stránky:

Download "APLIKOVANÁ STATISTIKA pro FRRMS"

Transkript

1 Mendelova zemědělská a lesncká unverzta v Brně Fakulta regonálního rozvoje a meznárodních studí APLIKOVANÁ STATISTIKA pro FRRMS Modul : Datový soubor zjšťování, prezentace a zpracování Prof. Ing. Bohuml Mnařík, CSc. Brno 2009

2 2

3 Vysvětlení použtých symbolů Průvodce studem objevuje se v úvodu a závěru modulu, zahajuje každou lekc, formuluje hlavní problémy, snaží se motvovat čtenáře, poukazuje na návaznost v problematce Abecední rejstřík použtých pojmů v úvodní část každé lekce. Rekaptuluje všechny důležté odborné termíny zavedené v lekc. Σ Bleskové otázky/úkoly v textu. Pokud jsou číslovány, čtenář nalezne v závěru lekce příslušné odpověd. Čtenář by se je měl snažt splnt dříve, než postoupí dál. Souhrn problematky lekce. Následuje po textu lekce. Odpověd na bleskové otázky v textu lekce. Cvčení k lekc. Pokud je to účelné a možné, nalezne čtenář řešení úkolů na konc modulu. Klíč ke cvčením ke všem lekcím v závěru modulu. Struktura modulu ttulní lst, použté symboly, struktura modulu a lekcí, obsah modulu, průvodce studem modulu úvod, jednotlvé lekce modulu, klíč ke cvčením ke všem lekcím, průvodce studem modulu závěr. Struktura lekce průvodce studem lekce, abecední rejstřík pojmů, text lekce proložený bleskovým otázkam a úkoly, souhrn lekce, odpověd na bleskové otázky, cvčení k lekc. 3

4 Obsah modulu Průvodce studem modulu úvodní část Lekce Zjšťování a typy dat.. Metody zjšťování dat.2. Výběrová zjšťování.3. Statstcká data.4. Tabulková a grafcká prezentace dat.5. Chyby v datech Lekce 2 Třídění a významné hodnoty 2.. Bodové třídění 2.2. Intervalové třídění 2.3. Významné hodnoty 2.4. Aproxmace typcké hodnoty a kvantlů u ntervalového třídění Lekce 3 Měření koncentrace 3.. Pojem koncentrace 3.2. Koncentrační křvka 3.3. Medál 3.4. Gnův ndex Klíč ke cvčením Průvodce studem závěrečná část Dodatek Použtí MS Excel pro tvorbu grafů

5 Ldé žjí v zajetí mnoha paradoxních omylů. Vezměme dva extrémní případy. Běžný lak nedokáže žádným způsobem předpovědět zatmění Slunce nebo Měsíce. Tyto jevy se dostavují velm nepravdelně a an v horzontu několka ldských žvotů není možno sebepečlvějším pozorováním dospět k jejch předpověd. Běžný člověk je tedy může oprávněně považovat za výsledek jakéhos nebeského chaosu a čsté náhody a odbýt je mávnutím ruky. Přesto jsou tyto jevy důsledkem velm přesné nebeské mechanky a odborníc jsou schopn je předvídat s velkou přesností. To, že se překvapvě dostaví nečekané zatmění, je možno (na rozdíl od ropných, fnančních, poltckých a mnoha jných krzí) zcela vyloučt. Na druhé straně lak očekává, že trubka o světlost 00 mm má světlost 00 mm, šroub o délce 50 mm má délku 50 mm, že balení másla zakoupené v obchodě má hmotnost 250 g, stejně jako to, že v půlltrové lahv pva se nachází přesně 500 ml tohoto moku. Zkrátka, považuje tyto velčny za konstantní. To ovšem není pravda. Odborník ví, že jde o realzace náhodných velčn, neboť konstruovat výrobní zařízení č plncí lnku, které pracují s absolutní přesností je, ne-l nemožné, tak alespoň velm drahé a především zbytečné. Odhlédneme-l od těchto extrémů a věnujeme se běžným náhodným jevům, jako jsou např. hustota osídlení, porodnost, příjmy domácností, apod., zjšťujeme, že je-l k dspozc zaznamenaný dostatečně početný soubor případů, začíná působt zákon velkých čísel a to, co bylo v jednotlvých zolovaných případech nepředvídatelné, začíná projevovat jstou zákontost a předvídatelnost. Hodíme-l jedenkrát jednou mncí, můžeme padnutou stranu předpovědět s 50% rzkem o- mylu. Ovšem čím víckrát hodíme, tím s větší jstotou očekáváme, že počet padnutých líců a rubů se bude téměř rovnat. Statstka, tak jak j prezentuje tato studjní opora, je exaktní věda (př preczním vedení výkladu by bylo možno j chápat jako určté odvětví matematky), jejímž úkolem je zjšťovat data (tj. provádět nejrůznější statstcká šetření), získaná data zpracovávat (např. podle různých hledsek uspořádat nebo třídt), zpracovaná data na různé úrovn analyzovat (typcky měřt různé vlastnost dat pomocí statstckých charakterstk), získané výsledky analýzy přměřeně prezentovat (zpravdla v tabulkové nebo grafcké podobě) pro potřeby odborné č lacké veřejnost. Tímto způsobem je statstka angažována v nejrůznějších oblastech ldské čnnost. Charakterstckým pro statstcká data je hromadnost pozorování (není problém shromáždt rozsáhlý počet případů), proměnlvost jednotlvých případů varablta. Statstka je emprckou vědou a poznatky, ke kterým dospívá, jsou tudíž vyvozeny z reálné skutečnost. Statstcké postupy a metody lze uplatnt také ve sféře studa problematky regonálního rozvoje. Data z této oblast splňují oba základní atrbuty (hromadnost a varabltu), proto vytvářejí rozsáhlé pole působnost pro uplatnění statstky. Smyslem použtí statstky je odhalt a popsat základní zákontost a pravdla, která stojí za zdánlvě (a jen na první povrchní pohled) chaotckou a nahodlou skutečností. Tento úvodní modul se ve třech lekcích věnuje zjšťování statstckých dat v nejrůznějších stuacích, jejch prezentac prostřednctvím grafů a tabulek, jejch zpracování zejména pomocí bodového a ntervalového třídění, stanovení významných hodnot netříděného a tříděného datového souboru, měření koncentrace datového souboru. 5

6 Lekce Zjšťování a typy dat Pokud má statstka naplnt své poslání, je třeba nejprve získat kvaltní a spolehlvé údaje data. Pod pojmem získávání dat je možno s představt rozsáhlý rejstřík postupů, od klasckých exaktních laboratorních měření např. fyzkálních velčn, přes získávání poněkud vágnějších a méně spolehlvých dat z evdence různých úřadů, nsttucí č frem, až po organzování různých dotazníkových šetření č řízených rozhovorů s respondenty v průzkumech veřejného mínění, socologckých výzkumech apod. Data, výsledky zpracování a výsledky analýzy je třeba přměřeným způsobem prezentovat. Základním problémem každých dat je exstence chyb, případně chybějících hodnot. Rámcový výklad problematky zjšťování dat, jejch typů a vlastností obsahuje právě tato první lekce. alternatvní znak; anketa; časová řada; číselný znak; datový soubor; hodnota znaku; hrubá chyba; chybějící hodnota; kardnální znak; matematcká statstka; množný znak; náhodná chyba; neúplné zjšťování; nevýběrová chyba; nomnální znak; obměna znaku; ordnální znak; popsná statstka; populace; pořadový znak; pravděpodobnostní výběr; prostý náhodný výběr; prosté pozorování; průřezová data; rozsah souboru; řízený experment; slovní znak; systematcká chyba; úplné zjšťování; výběrová chyba; výběrová jednotka; výběrový soubor; výběrové zjšťování; základní soubor; zjšťování. Metody zjšťování dat Podle podmínek zjšťování dat rozlšujeme řízené expermenty a prostá pozorování. Řízený experment znamená, že podmínky zjšťování jsou pod kontrolou expermentátora. Rušvé faktory jsou elmnovány, faktory jejchž vlv sledujeme jsou naopak fxovány na expermentátorem daných úrovních. Data vykazují přměřenou varabltu. Exstuje představa o chybách měření. Běžně se hovoří o plánování expermentů. Řízené expermenty zpravdla probíhají ve zkušebnách a laboratořích (tedy do jsté míry v umělých podmínkách), vyžadují čas a náklady, které mohou být někdy nepřměřené. V určtých oblastech jsou expermenty vyloučeny (nelze např. expermentálně ovlvňovat ceny nemovtostí, úrokové sazby z vkladů apod.). Prosté pozorování znamená, že podmínky zjšťování nejsou pod kontrolou pozorovatele. Rušvé faktory nejsou elmnovány. Pozorovatel nemá vlv an na faktory, jejchž působení hodlá sledovat a ty pak zpravdla nemají dostatečnou varabltu, aby se jejch vlv mohl průkazně projevt. Chybí představa o možných chybách pozorování. Prosté pozorování zpravdla probíhá v terénu, tedy v reálných podmínkách. Zpravdla vyžaduje menší čas a náklady. Používá se tam, kde je experment vyloučen nebo pokud není možno z časových nebo fnančních důvodů řízený experment zorganzovat. Je zřejmé, že v oblast regonálního rozvoje se běžně setkáme především s daty zjšťovaným v podmínkách prostého pozorování, bez možnost pozorovanou skutečnost jakkol ovlvnt. Najděte příklady řízených expermentů a prostých pozorování z vašeho dosavadního studa č praxe. 6

7 Podle úplnost zjšťování dat rozlšujeme úplná a neúplná zjšťování. Úplná zjšťování se snaží podchytt všechny exstující případy, kterých zpravdla bývá velm mnoho. Jsou časově a fnančně velm náročná a mnohdy tudíž praktcky neprovedtelná. Někdy se jm ovšem není možno vyhnout, protože například povnnost úplné evdence určtých jevů a událostí vyplývá ze zákona. Množna (mnohdy jen hypotetcká) zahrnující všechny možné případy se nazývá populace např. populace volčská, zákazncká, důchodců atd. atd. Neúplná zjšťování cíleně a vědomě zaznamenávají jen určtý vzorek (za chvíl použjeme pojem výběr) exstujících případů. Jejch cílem je šetřt čas a náklady. Někdy se jm nelze vyhnout. Jsou náročná na volbu stratege určení vzorku. Př tom se často využívá zákonů pravděpodobnost. I př neúplných zjšťováních je konečným cílem poznat zákontost, kterým se řídí jev jako celek. Základním předpokladem je v této souvslost reprezentatvnost vzorku. Neúplná zjšťování, jejchž výsledkem je získání reprezentatvního vzorku, se nazývají výběrová zjšťování. Kam zařadíme z hledska úplnost zjšťování např. evdenc dopravních nehod, sčítání ldu, výskyt určtého nákupního chování, cestování obyvatel mmo regon (turstka), preferenc určtého způsobu trávení volného času. ( ).2 Výběrová zjšťování Pravděpodobnostní výběr (také náhodný výběr) je základní metodou získání reprezentatvního vzorku. Pravděpodobnostní výběr předpokládá určení tzv. výběrové jednotky (stanovení toho, co se vybírá: jednotlvé regony, jednotlvé obce vybraného regonu, jednotlví obyvatelé vybrané obce); z příkladů vyplývá velm různá velkost výběrové jednotky v závslost na účelu zkoumání, stanovení pravděpodobnost zahrnutí výběrové jednotky do výběru (tento problém odsuneme stranou), ponechání náhodě (např. použtím losování nebo jné adekvátní tzv. znáhodňovací technky), která jednotka bude zahrnuta do výběru. Pravděpodobnostní výběr tedy představuje poměrně složtou a promyšlenou proceduru a nelze jej zaměňovat např. s namátkovým nebo samovolným výběrem, jejchž výsledkem reprezentatvní vzorek není. Zejména musíme upozornt, že často využívaná anketa rozhodně nesplňuje požadavky, kladené na reprezentatvnost vzorku. Pravděpodobnostní výběr lze klasfkovat na výběr s opakováním a výběr bez opakování (podle toho zda jednou vybraná jednotka může č nemůže být opakovaně zahrnuta do výběru), výběr se stejným a výběr s nestejným pravděpodobnostm, přímý neomezený výběr a složtěj uspořádaný výběr. Prostý náhodný výběr je nejjednodušším případem pravděpodobnostního výběru. Je defnovaný jako přímý neomezený výběr se stejným pravděpodobnostm prováděný s opakováním č bez opakování. Musíme ovšem upozornt na to, že v prax je právě prostý náhodný výběr jedním z nejméně vhodných výběrů. Daleko častěj jsou výběry organzovány jako složtěj uspořádané, kdy se cíleně využívá známých vlastností populace. Tato problematka ovšem přesahuje rámec našeho výkladu. Základní soubor populace je množna všech exstujících případů. Jejch počet rozsah populace se označuje písmenem N. 7

8 Výběrový soubor výběr je množna případů zahrnutých do výběru. Počet jednotek se nazývá rozsah výběru a označuje se písmenem n. V prax jde př výběru o to, mnmalzovat rozsah výběru (šetřt čas a peníze) př maxmalzac jeho nformační hodnoty. Pokud způsob získání a reprezentatvnost vzorku nejsou podstatné, hovoří se prostě o datovém souboru. Rozsah datového souboru se označuje rovněž symbolem n. Popsná statstka se zabývá popsem (deskrpcí) datového souboru. Matematcká statstka (statstcká ndukce) zobecňuje závěry získané na výběrovém souboru (reprezentatvním vzorku) pro celou populac. Popsná a matematcká statstka jsou dvě hlavní statstcké dscplíny. Matematcká statstka př tom vychází z počtu pravděpodobnost. Vyplývá to jak ze způsobu pořízení výběru, tak ze způsobu nakládání s nformacem zjštěným z výběru. Analyzujte Kam bychom v termnolog výběrových zjšťování zařadl např. losování Sportky? Co představuje 49 čísel přpravených v losovacím zařízení, jak nazveme 6 vylosovaných čísel, jaká je zde použta znáhodňovací technka? ( 2) případ tažení n drobných výrobků z krabce obsahující N výrobků. Všmněte s rozdílu mez výběrem s opakováním a bez opakování (např. maxmálně možný počet tahů, možnost opakovaně vybrat stejný výrobek apod.)..3 Statstcká data Vlastnost, které jsou aktuálním předmětem šetření, se v termnolog statstky nazývají znaky. V této souvslost pozor na termnologckou kolz (např. pojem znak v nformatce). Jako příklady statstckých znaků můžeme uvést např. počet obyvatel obce, počet členů domácnost, věk, pohlaví nebo povolání respondenta a mnoho dalších. Z těchto příkladů vyplývá, že znaků je mnoho typů, čemuž také odpovídají velm různorodá statstcká data. Základem klasfkace je dělení znaků na číselné a slovní. Číselný znak (zde lze využít alternatvně pojem velčna č proměnná) vykazuje číselné hodnoty, které mají prmárně význam velkost (např. počet členů domácnost, počet obyvatel obce, pořzovací cena nemovtost v ts. Kč). Číselné znaky, které budou v našem výkladu poněkud převažovat, můžeme klasfkovat jako měřtelné a pořadové. Měřtelný kardnální znak je výsledkem měření (např. měření ve fyzkálním slova smyslu). U kardnálních znaků je vedle relace větší, menší, roven, defnován rozdíl (o kolk) a u některých dokonce podíl (kolkrát). V tomto případě záleží na poloze nuly poměrový charakter mají jen znaky s přrozenou nulou. Znaky, které poměrový charakter nemají, se nazývají ntervalové. Pořadový ordnální znak vyjadřuje stupeň výskytu nějaké vlastnost a vztahují se k němu pouze relace větší, menší, roven. Kardnální znak lze převést na ordnální očíslováním jeho hodnot pořadovým čísly. Tímto je ztracena nformace o rozdílech mez hodnotam. Slovní nomnální znak vykazuje dvě nebo více slovně vyjádřených obměn (kategorí). Obměny nomnálních znaků lze číselně kódovat, čísla však postrádají význam velkost. Pokud nomnální znak vykazuje jen dvě obměny, jedná se o alternatvní (bnární, dchotomcký, dvojný) znak. Pokud nomnální znak vykazuje více než dvě obměny, hovoří se o množném znaku. Najděte příklady kardnálních, ordnálních a nomnálních znaků. Najděte příklady ntervalových a poměrových znaků (o kolk/kolkrát je jedna hodnota větší/menší než druhá). Najděte příklady alternatvních a množných slovních znaků. Zaujměte stanovsko k možnost vyjádřt o kolk/kolkrát/o kolk procent je jedna hodnota větší než druhá v případě (a) porovnání počtu obyvatel dvou obcí (např. 000 a 2200), (b) porovnání volebního zsku dvou stran v % (např. 40 a 5 %), (c) porovnání průměrných únorových teplot ve dvou letech změřených ve C (např. 4 a +2). 8

9 Statstcké údaje data jsou shromážděné hodnoty číselných, resp. obměny slovních znaků. Typckým prostředím pro uchování statstckých dat je tabulka tabulkového procesoru, případně mohou být data organzována v databáz, což usnadňuje jejch skladování, údržbu a aktualzac, stejně jako jejch operatvní získávání z velm rozsáhlých databází. V této souvslost se běžně používají pojmy jako datový sklad, datová pumpa, dolování dat apod. tyto termíny svědčí doslova o průmyslovém charakteru těchto čnností. K označování číselných znaků budeme používat velká písmena z konce abecedy, tj. např. X, Y, Z,. Jejch konkrétní hodnoty pak označíme odpovídajícím malým písmeny (x, y, z, ). Př rozsahu souboru n tvoří zjštěné hodnoty znaku X datovou řadu (datový vektor) x, x2,..., x,..., xn. Index souvsí přtom s pořadím zjšťování, takže datová řada je prmárně neuspořádaná. Datovou řadu umísťujeme zpravdla do jednoho sloupce tabulkového procesoru. n n 2 2 Seznamte se důkladně s významem zápsů n x, x, x. Vypočtěte hodnoty těchto výrazů pro datovou řadu x : 24, 6, 9, 0, 32. Mmořádně s výsledky: 49; 937; = = = 240 V prncpu se můžeme setkat s datovou řadou, jejíž jednotlvé hodnoty se vztahují ke shodnému časovému okamžku nebo ntervalu, ale různým případům (údaje o počtu obyvatel v souboru obcí jednoho regonu, o cenách stavebních pozemků v různých částech katastru obce, o zadluženost frem v určtém odvětví nebo regonu). Takováto statcká data nazýváme průřezovým údaj. Někdy je ovšem vhodné měřt dynamku, vývoj, určtého jevu v čase. Pak se jednotlvé údaje vztahují zpravdla k jednomu případu, ale k různým časovým obdobím (vývoj cen stavebních pozemků v určté lokaltě v období několka let, počet nově regstrovaných uchazečů o prác v jednotlvých měsících roku v působnost jednoho úřadu práce apod.). V tomto případě má datová řada charakter řady časové. V dalším výkladu se nejprve budeme věnovat datům průřezového charakteru. Časové řady budou předmětem našeho zájmu až pozděj..4 Tabulková a grafcká prezentace dat Statstcká tabulka je formálním prostředkem prezentace statstckých údajů, výsledků zpracování analýzy. S různým statstckým tabulkam se během dalšího výkladu budeme běžně setkávat. Př konstrukc tabulky (jejíž techncká stránka je dnes jž do značné míry záležtostí použtého textového nebo tabulkového procesoru) je třeba dodržovat některá pravdla, aby výsledný produkt splňoval jak nformační hodnotu, tak estetcké hledsko. Mez základní prvky tabulky patří: Číslo a název tabulky (ty jsou zcela nezbytné pokud dokument obsahuje více než jednu tabulku, aby bylo možno se na správnou tabulku jednoduše odvolat). Řádky a sloupce tabulky, přčemž podle potřeby často poslední řádek/sloupec slouží jako součtový. Číselné pole tabulky je tvořeno řádky a sloupc tabulky. Políčko (někdy po vzoru textových procesorů buňka) je základní jednotkou tabulky na průsečíku určtého řádku a sloupce. Záhlaví tabulky je tvořeno prvním řádkem tabulky, který zpravdla obsahuje názvy sloupců. Legenda tabulky je tvořena prvním sloupcem tabulky, který zpravdla obsahuje názvy řádků. Vysvětlvky a poznámky slouží k mnmalzac případných nejasností. Zdroj údajů pod tabulkou je třeba uvést zdroj údajů v tabulce obsažených, např. Statstcká ročenka ČR, vlastní údaje autora apod. Základní podmínkou srozumtelnost tabulky je, aby každé políčko tabulky bylo vyplněno: číslem, textem nebo smluvenou značkou. Mez běžně používané smluvené značky (jejch význam není třeba odborníkům zvlášť vysvětlovat) patří: 9

10 ležatá čárka ( ), která udává, že se nevyskytl žádný případ, případně nulovou hodnotu, ležatý křížek ( ) symbolzuje, že vyplnt políčko by bylo nelogcké, nula (0) umožňuje vyčstt tabulku od malých hodnot a udává, že hodnota v příslušném políčku nedosahuje polovny použté měrné jednotky (tj. např. označuje hodnotu menší než 500 kg v případě, že čísla jsou uváděna v tunách), tečka (.) v políčku tabulky nahrazuje neznámý nebo nespolehlvý údaj. Problematku prezentačních tabulek lustrujeme na jednoduchém příkladě (tabulka.). Tab.. Roční spotřeba nejdůležtějších druhů potravn na obyvatele v ČR (statstcká tabulka a její prvky) Legenda Rok Položka Oblovny Maso celkem 2 Mléko a mléčné výrobky 3 Ovoce a zelenna 60,8 82,0 87,8 50, 36,3 79,4 24, 57,9 45,8 79,8 220,6 52,2 Celkem 580,7 587,7 598,4 Číslo a název Záhlaví Číselné pole Součtový řádek Nealkoholcké nápoje Pvo Víno 2,3 56,9 5,4 206,0 59,9 6, 246,0 59,9 6,2 Políčko Celkem 293,6 382,0 422, Potravny jsou uvedeny v klogramech, nápoje v ltrech 2 Včetně kostí a vntřností Vysvětlvky 3 Kromě másla (patří mez tuky) Zdroj údajů: Zpracováno podle Statstcké ročenky ČR, ročník 2005, tabulka 9 9, str Pramen O grafech platí ještě více než o tabulkách, že vytvořt graf, který dokonale splní svoj nformační funkc, je současně věda umění. Podobně jako u tabulek uvedeme nejprve prvky grafu: Pro číslo a název grafu platí totéž co pro tabulky. Grafcký obraz sestává z geometrckých prostředků (body, čáry, plochy, apod.), smluvených prostředků (tloušťky, typy a barvy čar, vybarvení nebo šrafování ploch apod.) a pomocných prostředků (jako jsou osy, stupnce, sítě apod.), které především usnadňují čtení grafu. Legenda grafu je klíčem ke smluveným prostředkům. Další prvky jako poznámky a vysvětlvky č zdroj údajů se shodují s tabulkam. Je zřejmé, že grafcké vyjádření poskytuje obrovskou škálu možností a prostředků. Proto je velm obtížné systematcky klasfkovat veškeré statstcké grafy a každý výčet v tomto směru je nutně jen uvedením vybraných příkladů: Takže například můžeme podle použté souřadncové soustavy rozdělt grafy na pravoúhlé, polární a grafy, které souřadncovou soustavu nevyžadují (např. obrázkové grafy pktogramy). Podle počtu dmenzí rozlšujeme grafy na plošné (2D) a prostorové (3D). Poslední pak na pravé 3D (všechny 3 dmenze mají význam) a nepravé 3D (zde třetí dmenze pouze vytváří prostorový efekt). Podle požadavků na přesnost na obou koncích pomyslné škály leží vědecké grafy (vysoké nároky na přesnost) a popularzační dgramy (umožňují základní orentac bez větších nároků na přesnost). 0

11 Podle použtých grafckých prostředků rozdělujeme grafy na bodové (tečkové), čárové (spojncové), pruhové (vodorovné) a sloupcové (svslé), kruhové, bublnové, koncké ( damanty, hvězdce, tváře ) a mnohé jné. Podle typu dat, která zobrazují, rozlšujeme velké množství grafů, z nchž uvedeme často využívané grafy vývoje a grafy struktury, kterým se společně říká obchodní grafy. Svoj skupnu mají také burzovní grafy. Obr..2 Příklady statstckých grafů Spojncový graf slouží zpravdla ke znázornění vývoje. Plochy mez čaram narozených a zemřelých v Českých zemích v letech 785 až 2005 jsou v tomto případě využty pro znázornění přrozeného přírůstku/úbytku obyvatelstva. Zdroj ČSÚ. Kartogram míry nezaměstnanost v jednotlvých okresech ČR k Míra nezaměstnanost je znázorněna barevným odstínem. Alternatvním řešením je např. ve 3D zobrazení znázornt míru nezaměstnanost jako nadmořskou výšku příslušného okresu. Zdroj ČSÚ. Graf Chernoffovy tváře je sofstkovaný graf (tváře nejsou pouhé obrázky jako u pktogramu, ale jejch prvky znázorňují hodnoty určtých ukazatelů). Ze vzhledu jednotlvých tváří snadno odhadnete úroveň kvalty žvota v jednotlvých regonech. Zdroj vlastní data.

12 Kartodagram věkové struktury obyvatelstva v Jhomoravském kraj a kraj Vysočna. Mapa slouží jen jako pozadí pro výsečové grafy, které znázorňují věkovou strukturu populace: předproduktvní složka (do 9 let), produktvní (20 až 64 let) a poproduktvní složka (65+) populace v obou krajích. Výsečové grafy jsou opatřeny 3D efektem a mají vysunutou poslední výseč (kategore 65+). Vdíme, že věková struktura v obou krajích je praktcky dentcká. Zdroj ČSÚ. Specální typy grafů jsou např. kombnace grafu a mapy, kterým se říká kartogramy (pokud je mapa nepostradatelnou součástí grafu) nebo kartodagramy (mapa slouží spíše k ozvláštnění grafu). Moderní jsou obrázkové grafy pktogramy. Některé grafy dovedou překvapt. Např. graf Chernoffovy tváře je poměrně komplkovaně sestrojený graf umožňující posoudt podobnost objektů, které jsou popsány několka znaky. Pokud se podíváte na obrázek znázorňující kvaltu žvota v šest regonech podle několka vybraných ukazatelů (hodnota každého z nch souvsí s některým prvkem tváře), jstě se budete v tom, co graf slbuje, snadno orentovat..5 Chyby v datech Údaje nelze zjšťovat bezchybně. Naopak z jných zdrojů je čtenář jstě známo, že př měření (č jných technkách zjšťování údajů) nutně vznkají chyby. Náhodné chyby kupodvu vykazují určté zákontost. Nejnápadnější z nch je tendence kompenzovat se ve velkých datových souborech. Zákontost náhodných chyb jsou s použtím statstckých metod dobře popsatelné (např. lze odhadnout jejch možnou velkost), ale problematkou teore chyb se zabývat nebudeme. Systematcké chyby vznkají soustavným působením určtého čntele po celou dobu zjšťování. Jsou obtížně zjsttelné a pochoptelně u nch nelze hovořt o tendenc ke kompenzac s rostoucím počtem pozorování. Hrubé chyby vznkají v důsledku určtého momentálního selhání a pokud jsou to např. odlehlé hodnoty, dají se dentfkovat př uspořádání zjštěných hodnot podle velkost. Výběrová chyba vznká v důsledku ztráty nformace př výběrovém způsobu zjšťování, kdy populace je zastoupena výběrem. Vzhledem k tomu, že z populace lze zpravdla pořídt obrovský počet různých výběrů, lší se výsledky jejch popsu vzájemně mez sebou a také od výsledků, které bychom získal z celé populace (pokud by to bylo možné). Výběrové chyby jsou s použtím statstckých metod velm dobře popsatelné a ve své podstatě jde rovněž o náhodné chyby. 2

13 Nevýběrová chyba vznká sce př výběrovém způsobu zjšťování, ale je způsobena porušením pravdel hry, např. oslovením jné než původně náhodně vybrané domácnost, neprovedením zjšťování v hůře dostupné a řídce osídlené část regonu a nahrazením tohoto nedostatku svévolným rozšířením šetření v dostupnější část (např. velkém městě) apod. Chybějící hodnoty když nejde v pravém slova smyslu o chyby v datech, musíme počítat s tím, že někdy se nepodaří dohledat všechny údaje a jejch část chybí. Na tuto skutečnost v prax reagujeme různým metodam ošetření chybějících hodnot. Touto problematkou se ovšem nebudeme zabývat. Σ. Podle podmínek lze statstcká zjšťování klasfkovat na řízené expermenty a prostá pozorování. V našem případě je ovšem význam řízených expermentů jen okrajový. 2. Podle úplnost zjšťování lze statstcká zjšťování klasfkovat na úplná a neúplná. V našem případě je ovšem výskyt úplných zjšťování spíše sporadcký. 3. U neúplných zjšťování je rozhodujícím hledskem reprezentatvnost získaného vzorku. 4. Pokud zjšťování vede k reprezentatvnímu vzorku, hovoří se o výběrovém zjšťování. 5. Základní metodou výběrových zjšťování je pravděpodobnostní výběr a jeho nejjednodušším uspořádáním je prostý náhodný výběr. 6. Rozlšujeme popsnou statstku, pomocí níž provádíme deskrpc dat a matematckou statstku, kterou užíváme k zobecňování nformací získaných z výběrových souborů směrem k populac. 7. Vlastnost, které jsou předmětem šetření, se nazývají znaky. 8. Znaky klasfkujeme např. na kardnální, ordnální a nomnální. 9. Statstcké údaje mají buď průřezový charakter nebo tvoří časovou řadu. 0. Po celou dobu výkladu nás budou doprovázet statstcké tabulky a grafy. Tato lekce obsahuje základní nformace o nch.. Statstcké zjšťování je spojeno s výskytem chyb. Chyby klasfkujeme na náhodné, systematcké a hrubé. S výběrovým způsobem zjšťování jsou spojeny výběrová a nevýběrová chyba. (.) Sčítání obyvatel se řídí zákonem a je pokusem o úplné zjšťování; exstuje zákonná povnnost evdovat dopravní nehody s určtým parametry (výše škody, zranění nebo usmrcení osob apod.). Ve všech ostatních případech lze provádět pouze reprezentatvní nebo nereprezentatvní neúplné zjšťování (.2) Čísla v losovacím zařízení představují populac. Tažená šestce představuje náhodný výběr. Jde o prostý náhodný výběr bez opakování a znáhodňovací technkou je losování. 3

14 . Charakterzujte pojmy hromadnost a varablta. 2. Jaké jsou výhody a nevýhody prostého pozorování? 3. Jaké jsou výhody a nevýhody neúplných zjšťování? 4. Vysvětlete postup př pravděpodobnostním výběru. 5. Defnujte prostý náhodný výběr. 6. Zařaďte anketu z hledska reprezentatvnost získaného vzorku. 7. Exstuje (aspoň teoretcky) možnost, že rozsah výběru přesáhne rozsah populace? 8. Co je opakem deskrpce ve statstce? 9. Porovnejte obsah pojmů základní soubor, výběrový soubor, datový soubor. 0. S kterým statstckým znakem je spojen výraz hodnota/obměna.. O jakou nformac přcházíme, nahradíme-l naměřené hodnoty jejch pořadím? 2. Pokuste se vytvořt co nejpodrobnější schéma klasfkace statstckých znaků. 3. Které smluvené značky používáme ve statstckých tabulkách a jaký mají význam? 4. Jaké druhy grafckých prostředků společně vytvářejí grafcký obraz? 5. Co rozumíme pod pojmy obchodní grafy, pktogramy, kartogramy, kartodagramy? 6. Tvrdím, že rovněž výběrové chyby mají tendenc s rostoucím počtem případů (tedy výběrů) se kompenzovat. Mám pravdu? 7. Co rozumíme pod pojmem nevýběrová chyba? 4

15 Lekce 2 Třídění a významné hodnoty Ponechme nyní poněkud stranou různorodé poznatky první lekce týkající se zjšťování a typů dat a omezme se jen na nejjednodušší případ datových souborů tvořených hodnotam kardnálních znaků. Datovou řadu (datový vektor) jsme v první lekc označl x, x2,..., x,..., xn, kde ndex souvsí s pořadím zjšťování a datový soubor je tudíž neuspořádaný. Rozumným krokem je uspořádání datového vektoru (vzestupně nebo sestupně). Označme nyní x ( ), x(2),..., x( ),..., x( n) vzestupně uspořádaný datový vektor, pro jehož prvky platí x( ) x(2)... x( )... x( n) a kde je tedy x( ) = xmn, x( n ) = xmax (nejmenší a největší hodnota). Vektor hodnot x [ ], x[2],..., x[ ],..., x[ k ], pro který x [ ] < x[2] <... < x[ ] <... < x[ k ], přčemž n >> k, se nazývá vektor varant. Základní metodou zpracování dat je jejch třídění. Pokud lze v datovém souboru nalézt vektor varant (bez ohledu na rozsah souboru se v něm systematcky opakuje jen několk málo hodnot), vede to k bodovému (též prostému) třídění. V opačném případě jde o náročnější případ ntervalového třídění. Některé hodnoty uspořádaného datového souboru se vyznačují zvláštní polohou nebo jnou vlastností, jíž stojí za to s povšmnout. Ty se nazývají významné hodnoty. Ve druhé lekc se tedy budeme zabývat zásadam bodového a ntervalového třídění a tabulkovou a grafckou prezentací jeho výsledků. Nejdůležtějším pojmem této lekce je pojem rozdělení četností. Vedle toho se budeme rovněž věnovat významným hodnotám datové řady. Celá tato lekce se vztahuje k problematce zpracování dat. absolutní četnost; bodové třídění; četnost; četnostní funkce; četnostní hustota; decl; funkce četnostní hustoty; extrémní hodnota; hstogram; kumulatvní četnost; kvantl; kvartl; modus; oktl; percentl; p kvantl; relatvní četnost; rozdělení četností; sedecl; spojncový graf; střed ntervalu; stupňový graf; šířka ntervalu; úsečkový graf; třídcí nterval; typcká hodnota; varanta znaku 2. Bodové třídění Př bodovém třídění stačí nalézt vektor varant x [ ], x[2],..., x[ ],..., x[ k ] a pro každou varantu zjstt počet jejích výskytů četnost (také absolutní četnost). Četnost té varanty označíme n. Je k zřejmé, že n = n (kde n je rozsah souboru). = Rozdělení četností př bodovém třídění s můžeme představt jako dvousloupcovou tabulku, jejíž první sloupec tvoří prvky vektoru varant a druhý sloupec prvky vektoru četností (vz tab. 2. v následujícím příkladu 2.). Rovnocennou prezentací rozdělení četností př bodovém třídění je grafcké vyjádření pomocí úsečkového (hůlkového) grafu v pravoúhlé souřadncové soustavě (vz. obr. 2.). Vedle absolutních četností využíváme př prezentac rozdělení četností také 5

16 relatvní četnost, kde pro -tou varantu je její relatvní četnost být vyjadřovány také v %; pak se pracuje s hodnotam analogcky 00 %), p = k 00 p, přčemž = n ; tyto četnost mohou n p = (pro 00 p kumulatvní četnost (opět absolutníkn nebo relatvníkp ) vznkají kumulací (postupným načítáním) absolutních nebo relatvních četností postupně za jednotlvé varanty, např. kn = n j. Rovněž pro tyto četnost exstují adekvátní způsoby jejch grafckého vyjádření, které jsou patrné z řešeného příkladu 2.. Pro Příklad 2. zadání příkladu 2. vytvořte vzestupně uspořádaný datový vektor a nalezněte vektor varant. Zadání úlohy spočívá v tom, že u celkového počtu 25 domácností určté socální skupny byl zaznamenán počet dětí. Neuspořádaný datový vektor x : 4,3,2,2,4,0,,4,3,3,3,3,0,,,2,,2,,3,3,2,3,4,2 Bodové třídění údajů o počtu dětí v souboru n = 25 domácností. Tab. 2. Počet dětí x [ ] Tabulka rozdělení četností počtu dětí Absolutní četnost n Relatvní četnost (v %) 00 p 8,0 20,0 24,0 32,0 6,0 Kumulatvní četnost absolutní kn relatvní kp 0,08 0,28 0,52 0,84,00 Součet 25 00,0 Symbolem jsme v políčku součtového řádku označl, že sčítat kumulatvní četnost je nesmyslné. Obr. 2. Graf rozdělení četností (a) absolutních, (b) relatvních kumulatvních j= Počet dětí v domácnost Počet dětí v domácnost V prvním případě jde o úsečkový (hůlkový) graf. Ve druhém případě jsme relatvní kumulatvní četnost znázornl pomocí spojncového stupňového grafu. 6

17 Představte k x n Co udává součet součnů? Ve statstce s často klademe otázku, zda zjštěná hodnota je = pouze přblžná (odhadnutá) nebo zda jde o přesnou hodnotu. Jak je tomu v tomto případě? (2 ) s, že vedle příkladu 2. exstuje analogcký příklad, ovšem pro 2500 domácností, kde se opět vyskytují stejné varanty jako v př. 2.. Jakým způsobem zajstíme srovnatelnost výsledků třídění (porovnání jak se četností rozdělly mez jednotlvé varanty). (2 2) 2.2 Intervalové třídění U některých znaků nemá smysl určovat vektor varant, neboť počet varant může být (v krajním případě) roven rozsahu souboru n. V tomto případě se provádí rozdělení datového souboru do třídcích ntervalů a hovoří se o ntervalovém třídění. Zásady ntervalového třídění můžeme stručně shrnout takto: přměřený počet k třídcích ntervalů (např. orentačně k + 3,3 log n ), jejch nesporné vymezení (nesmí se an překrývat, an nedokrývat ), konstantní šířka ntervalu h (pokud to data dovolují), možnost otevřených krajních ntervalů (pro zařazení extrémních hodnot), jejchž šířka se také pro jednoduchost považuje za rovnu h. Vyberte vhodné vymezení třídcích ntervalů. Význam závorek je stejný jako př označování ntervalů na číselné ose. Přhlédněte přtom k druhé zásadě ntervalového třídění. Například: 00 (b) 00 ; 200, 200; 300,..., 600; 700 (a) ( ; 200),( 200; 300),...,( 600; 700) 00 (d) ( 00 ; 200 ;( 200; 300,...,( 600; 700 (c) ; 200), 200; 300),..., 600; 700) Př ntervalovém třídění je vektor varant nahrazen vektorem středů ntervalů (opět x ). Rozdělení četností př ntervalovém třídění je dvousloupcová tabulka, jejíž první sloupec tvoří středy ntervalů a druhý sloupec prvky vektoru četností (vz tab. 2.2 v následujícím příkladu 2.2). Rovnocennou možností je prezentovat rozdělení četností př ntervalovém třídění grafcky pomocí sloupcového grafu (hstogramu) v pravoúhlé souřadncové soustavě. Př ntervalovém třídění se využívají rovněž relatvní četnost kumulatvní četnost Příklad 2.2 kn, kp. O nch v odstavc 2.. p a také absolutní a relatvní Intervalové třídění údajů o počtu obyvatel v n = 87 venkovských obcích jednoho regonu. Výsledek třídění je obsažen v tabulce 2.2. Třídění jsme provedl do k = 6 ntervalů o konstantní šířce h = 300. První a poslední nterval jsme koncpoval jako otevřené, ale jejch šířku považujeme za rovnu h. Součet relatvních četností může vykázat zaokrouhlovací chybu. Nevyužtá políčka součtového řádku jsme opět označl symbolem, aby bylo zřejmé, že hodnoty příslušného sloupce nechceme sčítat. 7

18 Tab. 2.2 Vymezení třídcího ntervalu 200> (200;500> (500;800> (800;00> (00;400> (400+ Tabulka rozdělení četností počtu obyvatel venkovských obcí Střed třídcího Absolutní Relatvní ntervalu četnost absolutní x n četnost (v %) 00 p 27,6 3,0 2,8,5 4,6 3,4 Kumulatvní četnost kn relatvní kp 0,276 0,586 0,805 0,920 0,966,000 Součet 87 99,9 Šířku prvního a posledního ntervalu položíme rovněž h = 300. Obr. 2.2 Graf rozdělení četností (a) absolutních, (b) relatvních kumulatvních Středy tříd pro počet obyvatel obce Horní hrance tříd pro počet obyvatel obce V prvním případě jde o sloupcový graf se slepeným sloupc hstogram. Ve druhém případě jsme relatvní kumulatvní četnost znázornl pomocí spojncového grafu (lomená čára, často s typckým esovtým průběhem). Kumulatvní četnost se vynášejí prot horním hrancím ntervalů. Postačí k x n Co udává součet součnů? Ve statstce s často klademe otázku, zda zjštěná hodnota je = pouze přblžná (odhadnutá) nebo zda jde o přesnou hodnotu. Jak je tomu v tomto případě? (2 3) v případě ntervalového třídění relatvní četnost pro zajštění srovnatelnost výsledků třídění? Odhadněte, co by se stalo, pokud bychom obce podle počtu obyvatel třídl jemněj, např. do 8 ntervalů o šířce 00 obyvatel? (2 4) p Hustota četností je funkce f =, tj. relatvní četnost, přpadající na jednotku třídcího h ntervalu. Na rozdíl od relatvní četnost nezávsí na šířce ntervalu h, tj. na jemnost třídění, a zachovává s (přblžně) svůj průběh př třídění do stále většího počtu užších ntervalů. Lze s představt, že př extrémně jemném třídění přechází lomená čára znázorňující průběh relatvních kumulatvních četností v hladkou křvku a podobně hladkou čarou se obaluje hstogram hustoty četností. 8

19 Chápeme-l relatvní četnost př bodovém třídění a hustotu četností př ntervalovém třídění jako funkc hodnot znaku, dospíváme k pojmu četnostní funkce p(x) a funkce četnostní hustoty f(x). Četnostní funkce je nezáporná a normovaná 0 p( x), p( x) =. Četnostní hustota je nezáporná f (x) 0 a normovaná f ( x) dx = (plocha hstogramu četnostní hustoty je vždy rovna jedné). + x 2.3 Významné hodnoty V datové řadě je vhodné povšmnout s některých hodnot, které v ní mají určté zvláštní postavení. Mez tyto významné hodnoty patří Extrémní hodnoty v uspořádané řadě hodnoty x( ) = xmn ; x( n ) = xmax, tj. mnmální a maxmální hodnota. Vzdálenost těchto hodnot se nazývá varační rozpětí a označuje se symbolem R. Problémem extrémních hodnot může být to, že jedna nebo obě mohou být hrubým chybam. Typcká hodnota také modální hodnota (modus) představuje nejčastěj se vyskytující hodnotu (u netříděných dat a dat tříděných bodovým tříděním), u ntervalového třídění za n můžeme považovat střed ntervalu s nejvyšší četností. My však budeme používat přesnější aproxmac, která přhlíží k četnostem sousedících ntervalů. Modální hodnota znaku X se označuje xˆ (x se stříškou). Kvantly tvoří celou soustavu významných hodnot, u nchž s všímáme jejch polohy v uspořádané řadě hodnot. Hlavním kvantlem je tzv. medán, který rozděluje uspořádanou datovou řadu na dvě část se stejnou četností. Medán spolu s dalším dvěma kvartly (dolním a horním kvartlem) rozděluje datovou řadu na čtyř část se stejnou četností. Podobně devět declů nebo 99 percentlů rozděluje uspořádanou řadu na deset/sto částí o stejné četnost. Půlením četností mez kvartly naopak vznká řada alternatvních kvantlů, a to nejprve 7 oktlů, po nchž následuje 6 sedeclů. Příklad 2.3 Určíme medán v řadě netříděných hodnot. Datový soubor pro n = 8 x : 45,, 3,4, 2,0, 2, 3. Datový soubor pro n = 7 x : 45,, 3, 4, 2,0, 3 Uspořádaný datový soubor pro n = 8 x : 3, 0, 4,,3, 2, 2, 45 ( ) n Pořadové číslo medánu v uspořádaném datovém souboru je + 0,5 = 4, 5. Hodnota s (hypotetckým) pořadím 4,5 leží mez 4. a 5. hodnotou a určíme j jako průměr x 0,50 = = 2 2 Uspořádaný datový soubor pro n = 7 x : 3,0, 4,,3, 2, 45 ( ) n + 0,5 = 4 a medánem je tudíž přímo hodnota x 0,50 =. 2 Obecně hovoříme o P kvantlu (pro 0 < P < ), který je takovou hodnotou x P, pro kterou je relatvní četnost hodnot nejvýše rovných x p rovna P, zatímco relatvní četnost hodnot větších nebo rovných x P je rovna P. Jsou-l data tříděna bodovým tříděním, je P kvantlem ta varanta, u které poprvé kumulatvní relatvní četnost překračuje hodnotu P. U ntervalového třídění je odhadem P kvantlu střed ntervalu, u kterého opět poprvé kumulatvní relatvní četnost překračuje hodnotu P. Tento odhad lze rovněž zpřesnt, pokud předpokládáme, že kumulatvní četnost uvntř ntervalu roste 9

20 lneárně. Někdy se místo o P kvantlu hovoří o 00P % kvantlu (např. medán je tedy 50% kvantlem). Zcela obecně, 00P% kvantlem je hodnota x (), pro kterou je splněno 00P 00a a současně 00 00P 00b, kde a n j = 00, = pro =,2,..., n, j = 0,,2,..., n. Potřebné údaje pro náš příklad pro n = 7 b n uvádí tabulka. Příklad 2.4 Určíme např. 33% kvantl z netříděných dat pro n = 7 (příklad 2.3). Tab. 2.4 Určení kvantlů z netříděných dat x x () 00 a 00 7 n = 4,29 28,57 42,86 57,4 7,43 85,7 00,00 ( 3) = 00 b ,00 85,7 7,43 57,4 42,86 28,57 00 = 4,29 7 Pomocí údajů v tabulce nalezneme 33% kvantl. Pro třetí hodnotu podle velkost x 4 jako jednou je splněno 33 42, 86 a současně = 67 7, 43. Hodnota 4 je tedy 33% kvantlem. Je ovšem např. 39% kvantlem, neboť 39 42, 86 a současně = 6 7, 43. Upozorňujeme ovšem opět na to, že defnc kvantlu mohou vyhovět dvě za sebou jdoucí hodnoty. Využjte tabulky 2.4 a určete 60%, 70% a 90% kvantl. (2 5) Příklad 2.5 Určíme významné hodnoty pro příklad 2. (domácnost tříděné bodovým tříděním podle počtu dětí). V tabulce 2. snadno najdeme obě extrémní hodnoty (0 a 4 dět). Varanta s nejvyšší četností x ˆ = 3 (nejčastější výskyt zaznamenaly domácnost se třem dětm). Medánová (prostřední) varanta počtu dětí je rovna x 2 (u této varanty kumulatvní relatvní četnost poprvé překročla hodnotu 0,50). 0,50 = Všechny tyto hodnoty jsou určené přesně. Stejné hodnoty bychom obdržel z netříděných dat. U příkladu 2. určete dolní kvartl x 0, 25 a horní oktl x 0, Insprujte se příkladem 2.5. Úsporným a přehledným nástrojem pro zobrazení hlavních vlastností dat jsou tzv. krabcové grafy. Ukázku těchto grafů vz na obr. 2.3 v příkladu 2.6. Příklad 2.6 Krabcovým grafy znázorníme datové soubory x : 20, 0, 3, 20, 332,, 9, 52,, 7, 4, 0, 2, 23 pro n = 3, y : 0,, 2, 0, 5, 5, 5, 4, 7, 3, 7, 0, 9, 56,, 0, 0, 4, 32,, pro n = 2. 20

21 Obr. 2.3 Krabcové grafy n = 3 Odlehlé pozorování n = Výška krabce koresponduje s rozsahem souboru. Levá strana krabce představuje dolní kvartl, pravá horní kvartl. Příčka uvntř krabce je medán. Vlákna označují hrance hodnot, které nejsou detekovány jako odlehlé. 2.4 Aproxmace typcké hodnoty a kvantlů u ntervalového třídění Polohu modu lze v tomto případě určt s použtím vztahu nm nm xˆ = dm + h, n n n 2 m m m+ kde d m je dolní mez modálního ntervalu, n m, nm, nm+ jsou postupně četnost modálního, předchozího a následujícího ntervalu a h je šířka ntervalu. 00P 00kpq Polohu kvantlů uvntř ntervalu upřesníme podle vzorce xp = d q + h, 00p kde pro lbovolné P jsou q q d, p postupně dolní mez a relatvní četnost ntervalu (q tého) obsahujícího příslušný kvantl, kp q je součtová relatvní četnost předchozího ntervalu a h je šířka ntervalu. Příklad 2.7 Pomocí právě uvedených vzorců odhadneme polohu typcké hodnoty a medánu pro obce tříděné podle počtu obyvatel (příklad 2.2). Údaje budeme čerpat z tabulky 2.2. Typcká hodnota leží ve druhém ntervalu a její hrubou aproxmací je jeho střed (350 obyvatel). Tuto 3 hodnotu zkorgujeme x ˆ = = 282. Vzhledem k tomu, že více je obsazen první nterval, je typcká hodnota posunuta vlevo od středu ntervalu. Medán leží rovněž ve druhém ntervalu. Za předpokladu, že by hodnoty uvntř ntervalu byly rozděleny rovnoměrně, je medán x 50 27,6 0,50 = = Určete horní kvartl pro příklad 2.2. (2 6) q 2

22 Σ. Základní metodou zpracování dat ve statstce je metoda třídění. 2. Podle typu dat se používá buď bodové nebo ntervalové třídění. 3. Výsledkem třídění je rozdělení četností. 4. Rozdělení četností lze vyjádřt v tabulkové nebo grafcké podobě. 5. Rozdělení četností př bodovém třídění tvoří vektor varant a vektor četností. 6. Rozdělení četností př ntervalovém třídění tvoří vektor středů ntervalů a vektor četností. 7. Vedle absolutních četností se používají četnost relatvní a rovněž absolutní a relatvní kumulatvní četnost. 8. Formálně se u bodového třídění zavádí četnostní funkce a u ntervalového třídění funkce četnostní hustoty. 9. V datovém souboru lze najít významné hodnoty extrémní hodnoty, typckou hodnotu (modus) a kvantly. 0. Soustava kvantlů obsahuje především medán, kvartly, decly a percently. Alternatvně pak po kvartlech následují oktly a sedecly.. Všechy významné hodnoty lze určt zcela přesně pro netříděná data a data tříděná bodovým tříděním. 2. U ntervalového rozdělení četností je možno aproxmovat polohu typcké hodnoty a kvantlů uvntř příslušných tříd. (2 ) Uvedený výraz představuje úhrn (součet) hodnot znaku datového souboru tříděného bodovým tříděním. Jde o přesnou hodnotu. (2 2) K zajštění srovnatelnost obou rozdělení četností postačí použít relatvní četnost. (2 3) U ntervalového třídění jde rovněž o úhrn (součet) hodnot znaku. Na rozdíl od bodového třídění jde jen o odhadovanou hodnotu (střed ntervalu reprezentuje hodnoty ležící uvntř ntervalu nedokonale). (2 4) Se zvyšující se jemností třídění (větší počet užších ntervalů) klesají absolutní relatvní četnost. Srovnatelnost rozdělení četností př ntervalovém třídění zabezpečuje hustota četností. (2 5) x = x = ; x 45. 0,60 0,70 3 0, 90 = (2 6) x ,75 =. Zpracujte po vzoru příkladu 2. bodové třídění výsledků nejméně 30 hodů hrací kostkou, které sam provedete. Určete relatvní a kumulatvní četnost. Sestavte tabulku rozdělení četností a proveďte grafcké znázornění po vzoru obr Zpracujte po vzoru příkladu 2.2 ntervalové třídění fktvního datového souboru, jehož zadání obdržíte. Třídění proveďte alternatvně do šest a do 2 ntervalů. Porovnejte grafy absolutních a relatvních četností a grafy hustot četností obou varant. 3. Jaké hodnoty nabývá, případně jaký má smysl, součet absolutních četností, relatvních četností a kumulatvních četností? 4. Co je hstogram a jaké je jeho použtí? 22

23 5. Graf které četnost a př jakém třídění má stupňovtý průběh? 6. Objasněte pojem varační rozpětí. 7. Určete kvartly pro datový soubor x : 45,, 3, 4, 2,0, 2,3, Určete kvartly u příkladu v zadání. 9. Určete kvartly u příkladu 2. Nejprve zkuste vyhledat přesné hodnoty kvartlů v netříděných datech. Pak porovnejte tyto přesné hodnoty s odhady, které získáte př třídění dat do šest ntervalů. 0. Jak se nazývají kvantly, které rozdělují uspořádaný datový soubor na čtyř, osm, deset, šestnáct a sto částí o stejné četnost a jaký je jejch počet?. Jak jnak (společně) můžeme pojmenovat vždy prostřední ze všech těchto kvantlů? 23

24 Lekce 3 Měření koncentrace Pod pojmem koncentrace rozumíme jak rovnoměrně, č spíše jak nerovnoměrně, jsou hodnoty znaku rozprostřeny mez jednotlvé prvky datového souboru. Nulová koncentrace odpovídá stavu, kdy všechny hodnoty datového souboru jsou stejné. V opačném případě jde o větší nebo menší koncentrac, kterou můžeme vyjádřt charakterstkam koncentrace koncentrační křvkou, medálem a Gnovým ndexem. Podmínkou pro měření koncentrace je, aby znak byl sčtatelný. Pokud tomu tak není, je třeba ho na sčtatelný znak převést. Např. počet obyvatel na jednotku plochy (hustota) je nesčtatelná, kdežto každá z obou velčn, které hustotu tvoří (počet obyvatel, plocha), sčtatelná je. Koncentrac můžeme měřt jak pro netříděná data, tak pro data tříděná bodovým nebo ntervalovým tříděním. koncentrace; koncentrační křvka; Lorenzova křvka; medál; relatvní kumulatvní četnost; relatvní kumulatvní úhrn hodnot znaku; sčtatelný znak 3. Pojem koncentrace Povšmněme s nyní zvláště rozdělení četností tzv. sčtatelných znaků, tj. znaků, u nchž má smysl součet (úhrn) hodnot znaku za část jednotek souboru, případně za soubor jako celek. U takovýchto znaků, jak jsme se jž dříve zmínl, reprezentuje u ntervalového třídění součn x n odhad k ntervalového úhrnu a součet těchto součnů x n je odhadem úhrnu hodnot znaku za celý soubor, = zatímco u prostého třídění jde vesměs o přesné hodnoty. Vytvořme nyní kumulatvní, v % vyjádřenou j= velčnu 00kq = k 00 pro, j =, 2,..., k. Tato velčna reprezentuje podíl úhrnu prvních x n = x j n j ntervalů na úhrnu hodnot znaku celého souboru. U sčtatelných znaků má smysl tuto velčnu zkoumat ve vztahu ke kumulatvní relatvní četnost 00kp = k 00. n Právě vzájemné porovnání průběhu obou těchto velčn (např. v grafu) se nazývá měření koncentrace datového souboru. Zvažte, ve kterých případech lze měřt koncentrac: soubor respondentů podle vzdělání, soubor domácností podle příjmů, soubor pozemků podle hektarového výnosu plodny, soubor výrobků podle zskové marže (zsk/tržby). Pokuste se o zdůvodnění. 3.2 Koncentrační křvka Pokud do grafu, na jehož osách jsou velčny 00 kq, 00kp, vyneseme vypočtené hodnoty, které spojíme lomenou čarou, eventuálně hladkou křvkou, získáme koncentrační Lorenzovu křvku. Tato křvka vypovídá o rovnoměrnost (resp. nerovnoměrnost) rozdělení úhrnu hodnot znaku mez jednotlvé ntervaly (varanty znaku u bodového třídění nebo v případě netříděných dat mez jednotlvé j= = n j 24

25 případy). Pokud by byly všechny hodnoty znaku v souboru konstantní, hodnoty v obou vyznačených sloupcích tabulky by se rovnaly a Lorenzova křvka by odpovídala na grafu vyznačené úhlopříčce. Na obr. 3. jsou příklady koncentračních křvek (znázorněných prostřednctvím lomených čar) pro různý charakter osídlení regonu. Pokud by hustota osídlení byla na celé ploše konstantní, byla by koncentrační křvkou úhlopříčka obrázku. S rostoucí nerovnoměrností osídlení roste zakřvení koncentrační křvky (vz obrázek 3.). Obr. 3. Koncentrační křvky př různé rovnoměrnost osídlení regonu Kumulatvně (v %) vyjádřený podíl na počtu obyvatel Kumulatvně (v %) vyjádřený podíl na území regonu Z obrázku např. vyplývá, že v regonu s nejméně rovnoměrným osídlením na 0 % území regonu žje 40 % jeho obyvatel, zatímco zbývajících 60 % obyvatel má k dspozc 90 % rozlohy. Ve druhém reálném případě na 20 % území regonu žje 30 % obyvatel. V deálním případě zcela rovnoměrného osídlení by určté procento obyvatel žlo na část výměry vyjádřené stejnou hodnotou (vz tečkovaná úhlopříčka obrázku). 3.3 Medál U sčtatelných znaků je medál hodnota znaku, která půlí úhrn hodnot znaku souboru na dvě stejné část. Čím více je hodnota medálu vzdálena od hodnoty medánu, tím větší je nerovnoměrnost rozdělení celkového úhrnu hodnot znaku mez jednotlvé případy a tím větší je nepoměr mez počtem jednotek, které se dělí o každou z jeho polovn. Obr. 3.2 Poloha medálu Kumulatvně (v %) vyjádřený podíl na počtu obyvatel Kumulatvně (v %) vyjádřený podíl na území regonu Na našem příkladu vdíme současně, že zatímco 50 % rozlohy regonu obývá as 90 % jeho populace, tak naopak 50 % populace se musí spokojt s necelým 20 % jeho území. 25

26 Způsob určení medálu se podobá určení medánu. Vzorec medálu kde M je označení pro medálový nterval. x M = d M 50 00kqM + xm nm 00 k x n = h, Příklad 3. Určíme medálovou obec, tj. velkost obce, v níž by př uspořádání obcí podle velkost žl prostřední obyvatel z celkového počtu. Použjeme data z příkladu 2.2. Tab. 3. Pomocná tabulka pro určení medálu Střed třídcího Absolutní x jn j ntervalu četnost x n j= x n 00 k x n = 2,85 25,27 54,57 77, 88,97 00,00 Kumulatvní relatvní četnost (v %) 00 p 27,6 58,6 80,4 9,9 96,5 99, Takže např. odhadujeme, že ve třetí velkostní skupně obcí (500; 800> žje 2350 obyvatel, zatímco ve všech 87 obcích je to 4250 obyvatel. Pro třetí velkostní skupnu obcí je ,27 = 54,57 %. Medál x M = = 753 ukazuje, že prostřední z celkového počtu obyvatel žje ve (fktvní) obc se 753 obyvatel. Všmněte s, že medál nabyl vyšší hodnoty než medán ( x 47; x 753 ). Není to náhoda, je tomu tak vždy, když data jsou varablní (v souboru se 0,50 = M = vyskytují různě velké obce). S využtím posledních dvou sloupců tabulky 3. sestrojte koncentrační křvku (postačí lomená čára) pro příklad o počtu obyvatel obcí 2.2. Kumulatvní četnost (pro určení medánu nebyly potřeba) vyneste na svslou osu. Křvka vychází z počátku. 3.3 Gnův ndex Hodnott míru zakřvení koncentrační křvky (v našem případě lomené čáry) není jednoduché. Proto se jako ukazatel koncentrace využívá Gnův ndex, který vyjadřuje, jakou část plochy trojúhelníku obrazce pokrývá plocha pod koncentrační křvkou. Je zřejmé, že Gnův ndex je bezrozměrné (eventuálně v % vyjádřené) číslo, kde 0 G <. Konečně, an určení této plochy není trvální záležtostí a k výpočtu ndexu se využívá řada aproxmací, které ovšem nebudeme uvádět. 26

27 Obr. 3.3 Prncp Gnova ndexu Kumulatvně (v %) vyjádřený podíl na počtu obyvatel Plocha trojúhelníku Plocha pod křvkou Kumulatvně (v %) vyjádřený podíl na území regonu Σ.. Pro datové soubory sčtatelných číselných znaků má smysl zkoumat jejch koncentrac. 2. Koncentrac lze měřt u netříděných dat, stejně jako u dat tříděných bodovým nebo ntervalovým tříděním. 3. Charakterstkam souvsejícím s koncentrací jsou koncentrační křvka, medál a Gnův ndex. 4. Nejnžší míru koncentrace vykazují data, jejchž všechny hodnoty jsou konstantní. Na opačném pólu jsou data tvořená jak extrémně vysokým, tak nízkým hodnotam. 5. Měření koncentrace má význam jak v hospodářské oblast (koncentrace společenského bohatství, monopolzace odvětví), tak v oblast demografcké a geografcké (např. koncentrace obyvatelstva). Určete charakterstky koncentrace (ty které znáte) pro příklad z lekce o třídění. 2. Určete charakterstky koncentrace (ty které znáte) pro příklad 2 z lekce o třídění. 3. V regonu působí v určtém odvětví 5 frem. Výše jejch produkce, vyjádřená v ročních tržbách je 3, 7, 5, 2 a 43 ml. Kč. Sestrojte pro tento případ koncentrační křvku. Ve které frmě je realzována prostřední koruna tržeb? Lekce. 6. Najděte odpověď v textu lekce. 7. U výběru s opakováním může (alespoň teoretcky) počet tahů n převýšt rozsah populace N. 7.. Najděte odpověď v textu lekce. 2. Znaky klasfkujte na číselné a slovní. Číselné pak na kardnální a ordnální. Kardnální znaky na ntervalové a poměrové. Slovní znaky klasfkujte na alternatvní a množné Najděte odpověď v textu lekce. 6. Ano. 7. Najděte odpověď v textu lekce. 27

28 Lekce Výsledky jsou ndvduální (podle zadání). 3. Rozsah souboru, jedna (00 %), součet kumulatvních četností nemá smysl Odpověd vyplývají přímo z textu lekce. R = x max x. 6. mn 7. Prostudujete-l s příklad 2.4, získáte x = ; x = ; x 2. 0,25 0 0,50 0, 75 = Výsledky jsou ndvduální (podle zadání). 0. Tř kvartly, sedm oktlů, devět declů, 5 sedeclů, 99 percentlů.. Vždycky jde o medán. Lekce Výsledky příkladů jsou ndvduální. 3. Křvku vytvořte z hodnot 00 kp kq 0 2,86 7,4 7,4 38,57 00,00 Prostřední koruna tržeb je tedy realzována ve frmě s největším tržbam. Tento úvodní modul se ve třech lekcích věnoval zjšťování dat v nejrůznějších stuacích, jejch zpracování (zejména třídění), měření koncentrace datového souboru. Po jeho prostudování by měl mít čtenář základní představu o pořzování dat př nejrůznějších statstckých šetřeních. Měl by rozlšovat řízený experment a prostá pozorování, úplná a neúplná zjšťování. Měl by vědět, že nejspolehlvějším způsobem získání reprezentatvního vzorku je pravděpodobnostní výběr. Měl by mít představu o základních druzích statstckých znaků, se kterým se může v prax setkat. Měl by vědět, že neexstují bezchybná data. Měl by praktcky zvládnout případ bodového a ntervalového třídění, sestavt tabulku rozdělení četností a zvládat grafcké znázornění rozdělení četností. Měl by vědět, které jsou významné hodnoty datového souboru a umět je určt z netříděných dat, dat tříděných bodovým tříděním a přblžně z dat tříděných ntervalovým tříděním. Získat představu o koncentrac jako vlastnost datového souboru, která vypovídá o rovnoměrnost č nerovnoměrnost rozdělení hodnot znaku mez jednotlvé případy. Umět se sestrojt a nterpretovat koncentrační křvku pro tříděná netříděná data. Stanovt medál datového souboru a dokázat ho smysluplně nterpretovat. Získat rámcovou představu o způsobu konstrukce Gnova ndexu (bez konkrétního výpočtu). V dalším studu lze pokračovat modulem 2 Pops datového souboru prostřednctvím charakterstk 28

29 Dodatek Použtí MS Excel pro tvorbu grafů Doporučujeme používat průvodce tvorbou grafu. Rozdělení četností Absolutní 30 četnost Středy ntervalů Algortmus: Vložt data Vybrat nabídku Vložt Graf Zobrazí se dalogové okno Průvodce grafem Vybereme typ grafu, defnujeme datové řady, zvolíme název grafu, popsky os, umístění grafu (průvodce krok až 4). Po vložení grafu můžeme graf dále lbovolně upravovat (vz například dalogové okno vlevo). Pro každý prvek grafu je umožněno otevřít dalogové okno pro jeho úpravy. My jsme např. v našem grafu upravl barvu sloupců a zrušl mezery mez nm. Možných je několk desítek typů grafů, počet jejch možných varant a úprav nelze dost dobře vyčíslt. 29

Statistická šetření a zpracování dat.

Statistická šetření a zpracování dat. Statstcká šetření a zpracování dat. Vyjadřovací prostředky ve statstce STATISTICKÉ TABULKY Typckým vyjadřovacím prostředkem statstky je číslo formalzovaným nástrojem číselného vyjádření je statstcká tabulka.

Více

Třídění a významné hodnoty

Třídění a významné hodnoty Lekce Třídění a významné hodnoty Ponechme nyní oněkud stranou různorodé oznatky rvní lekce týkající se zjšťování a tyů dat a omezme se jen na nejjednodušší říad datových souborů tvořených hodnotam kardnálních

Více

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší

Více

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu 6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a

Více

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM 7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM Průvodce studem Předchozí kaptoly byly věnovány pravděpodobnost a tomu, co s tímto pojmem souvsí. Nyní znalost z počtu pravděpodobnost aplkujeme ve statstce. Předpokládané

Více

4. Třídění statistických dat pořádek v datech

4. Třídění statistických dat pořádek v datech 4. Třídění statstcých dat pořáde v datech Záladní členění statstcých řad: řada časová, řada prostorová, řada věcná věcná slovní řada, věcná číselná řada. Záladem statstcého třídění je uspořádání hodnot

Více

POROVNÁNÍ MEZI SKUPINAMI

POROVNÁNÍ MEZI SKUPINAMI POROVNÁNÍ MEZI SKUPINAMI Potřeba porovnání počtů mez určtým skupnam jednců např. porovnání počtů onemocnění mez kraj nebo okresy v prax se obvykle pracuje s porovnáním na 100.000 osob. Stuace ale nebývá

Více

Diskrétní náhodná veličina

Diskrétní náhodná veličina Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné

Více

2. Statistická terminologie a vyjadřovací prostředky. 2.1. Statistická terminologie. Statistická jednotka

2. Statistická terminologie a vyjadřovací prostředky. 2.1. Statistická terminologie. Statistická jednotka 2. Statistická terminologie a vyjadřovací prostředky 2.1. Statistická terminologie Statistická jednotka Statistická jednotka = nositel statistické informace, elementární prvek hromadného jevu. Příklady:

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ Abstrakt Martn Cupal 1 Prncp tvorby tržní ceny nemovtost je sce založen na tržní nabídce a poptávce, avšak tento trh je značně nedokonalý. Nejvíce ovlvňuje

Více

Energie elektrického pole

Energie elektrického pole Energe elektrckého pole Jž v úvodní kaptole jsme poznal, že nehybný (centrální elektrcký náboj vytváří v celém nekonečném prostoru slové elektrcké pole, které je konzervatvní, to znamená, že jakýkolv jný

Více

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla KOMPLEXNÍ ČÍSLA Příklad Řešte na množně reálných čísel rovnc: x + = 0. x = Rovnce nemá v R řešení. Taková jednoduchá rovnce a nemá na množně reálných čísel žádné řešení! Co s tím? Zavedeme tzv. magnární

Více

2.3 Prezentace statistických dat (statistické vyjadřovací prostředky)

2.3 Prezentace statistických dat (statistické vyjadřovací prostředky) 2.3 Prezentace statistických dat (statistické vyjadřovací prostředky) Statistika musí výsledky své práce převážně číselná data prezentovat (publikovat, zveřejňovat) jednoduše, srozumitelně a přitom výstižně.

Více

Matematika I A ukázkový test 1 pro 2018/2019

Matematika I A ukázkový test 1 pro 2018/2019 Matematka I A ukázkový test 1 pro 2018/2019 1. Je dána soustava rovnc s parametrem a R x y + z = 1 x + y + 3z = 1 (2a 1)x + (a + 1)y + z = 1 a a) Napšte Frobenovu větu (předpoklady + tvrzení). b) Vyšetřete

Více

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ. CHYBY MĚŘENÍ Úvod Představte s, že máte změřt délku válečku. Použjete posuvné měřítko a získáte určtou hodnotu. Pamětlv přísloví provedete ještě jedno měření. Ale ouha! Výsledek je jný. Co dělat? Měřt

Více

Ivana Linkeová SPECIÁLNÍ PŘÍPADY NURBS REPREZENTACE. 2 NURBS reprezentace křivek

Ivana Linkeová SPECIÁLNÍ PŘÍPADY NURBS REPREZENTACE. 2 NURBS reprezentace křivek 25. KONFERENCE O GEOMETRII A POČÍTAČOVÉ GRAFICE Ivana Lnkeová SPECIÁLNÍ PŘÍPADY NURBS REPREZENTACE Abstrakt Příspěvek prezentuje B-splne křvku a Coonsovu, Bézerovu a Fergusonovu kubku jako specální případy

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Čísla a aritmetika. Řádová čárka = místo, které odděluje celou část čísla od zlomkové.

Čísla a aritmetika. Řádová čárka = místo, které odděluje celou část čísla od zlomkové. Příprava na cvčení č.1 Čísla a artmetka Číselné soustavy Obraz čísla A v soustavě o základu z: m A ( Z ) a z (1) n kde: a je symbol (číslce) z je základ m je počet řádových míst, na kterých má základ kladný

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d Korelační energe Referenční stavy Energ molekul a atomů lze vyjádřt vzhledem k různým referenčním stavům. V kvantové mechance za referenční stav s nulovou energí bereme stav odpovídající nenteragujícím

Více

2. Definice pravděpodobnosti

2. Definice pravděpodobnosti 2. Defnce pravděpodobnost 2.1. Úvod: V přírodě se setkáváme a v přírodních vědách studujeme pomocí matematckých struktur a algortmů procesy dvojího druhu. Jednodušší jsou determnstcké procesy, které se

Více

Neparametrické metody

Neparametrické metody Neparametrcké metody Přestože parametrcké metody zaujímají klíčovou úlohu ve statstcké analýze dat, je možné některé problémy řešt př neparametrckém přístupu. V této přednášce uvedeme neparametrcké odhady

Více

MODELOVÁNÍ A SIMULACE

MODELOVÁNÍ A SIMULACE MODELOVÁNÍ A SIMULACE základní pojmy a postupy vytváření matematckých modelů na základě blancí prncp numerckého řešení dferencálních rovnc základy práce se smulačním jazykem PSI Základní pojmy matematcký

Více

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...)

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...) . NÁHODNÁ VELIČINA Průvodce studem V předchozích kaptolách jste se seznáml s kombnatorkou a pravděpodobností jevů. Tyto znalost použjeme v této kaptole, zavedeme pojem náhodná velčna, funkce, které náhodnou

Více

REGRESNÍ ANALÝZA. 13. cvičení

REGRESNÍ ANALÝZA. 13. cvičení REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká

Více

Vícekriteriální rozhodování. Typy kritérií

Vícekriteriální rozhodování. Typy kritérií Vícekrterální rozhodování Zabývá se hodnocením varant podle několka krtérí, přčemž varanta hodnocená podle ednoho krtéra zpravdla nebývá nelépe hodnocená podle krtéra ného. Metody vícekrterálního rozhodování

Více

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První Numercká matematka 1 Parabolcké rovnce Budeme se zabývat rovncí t = D u x (1) tato rovnce určuje chování funkce u(t, x), která závsí na dvou proměnných. První proměnná t mívá význam času, druhá x bývá

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska

Více

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina 3 VBRANÉ MODEL NÁHODNÝCH VELIČIN 3. Náhodná velčna Tato kaptola uvádí stručný pops vybraných pravděpodobnostních modelů spojtých náhodných velčn s důrazem na jejch uplatnění př rozboru spolehlvost stavebních

Více

STATISTIKA PRO NELÉKAŘSKÉ ZDRAVOTNICKÉ OBORY

STATISTIKA PRO NELÉKAŘSKÉ ZDRAVOTNICKÉ OBORY STATISTIKA PRO NELÉKAŘSKÉ ZDRAVOTNICKÉ OBORY Eva Reterová Olomouc 06 Fakulta zdravotnckých věd Unverzta Palackého v Olomouc Statstka pro nelékařské zdravotncké obory Eva Reterová Olomouc 06 Oponent: PhDr.

Více

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny 0.05 0.0 0.05 0.0 0.005 Nomnální napětí v pásnc Std Mean 40 60 80 00 0 40 60 Std Téma 5: Parametrcká rozdělení pravděpodobnost spojté náhodné velčn Přednáška z předmětu: Pravděpodobnostní posuzování konstrukcí

Více

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou)

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou) Náhodná velčna na Výsledek náhodného pokusu, daný reálným číslem je hodnotou náhodné velčny. Náhodná velčna je lbovolná reálná funkce defnovaná na množně elementárních E pravděpodobnostního prostoru S.

Více

ANALÝZA RIZIKA A JEHO CITLIVOSTI V INVESTIČNÍM PROCESU

ANALÝZA RIZIKA A JEHO CITLIVOSTI V INVESTIČNÍM PROCESU AALÝZA RIZIKA A JEHO CITLIVOSTI V IVESTIČÍM PROCESU Jří Marek ) ABSTRAKT Príspevek nformuje o uplatnene manažmentu rzka v nvestčnom procese. Uvádza príklad kalkulace rzka a analýzu jeho ctlvost. Kľúčové

Více

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y 4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.

Více

Náhodné chyby přímých měření

Náhodné chyby přímých měření Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.

Více

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Markéta Brázdová 1 Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Klíčová slova: odbavování záslek, centrum grafu, vážená excentrcta vrcholů sítě, časová náročnost odbavení záslky, vážená

Více

LOGICKÉ OBVODY J I Ř Í K A L O U S E K

LOGICKÉ OBVODY J I Ř Í K A L O U S E K LOGICKÉ OBVODY J I Ř Í K A L O U S E K Ostrava 2006 Obsah předmětu 1. ČÍSELNÉ SOUSTAVY... 2 1.1. Číselné soustavy - úvod... 2 1.2. Rozdělení číselných soustav... 2 1.3. Polyadcké číselné soustavy... 2

Více

Název DUM: VY_32_INOVACE_2B_16_ Tvorba_grafů_v_MS_Excel_2007

Název DUM: VY_32_INOVACE_2B_16_ Tvorba_grafů_v_MS_Excel_2007 Název školy: Základní škola a Mateřská škola Žalany Číslo projektu: CZ. 1.07/1.4.00/21.3210 Téma sady: Informatika pro sedmý až osmý ročník Název DUM: VY_32_INOVACE_2B_16_ Tvorba_grafů_v_MS_Excel_2007

Více

Simulační metody hromadné obsluhy

Simulační metody hromadné obsluhy Smulační metody hromadné osluhy Systém m a model vstupy S výstupy Systém Část prostředí, kterou lze od jeho okolí oddělt fyzckou neo myšlenkovou hrancí Model Zjednodušený, astraktní nástroj používaný pro

Více

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST Abstrakt ANALÝZA ZKA A CTLOST JAKO SOUČÁST STUDE POVEDTELNOST 1. ČÁST Jří Marek Úspěšnost nvestce závsí na tom, jaké nejstoty ovlvní její předpokládaný žvotní cyklus. Pomocí managementu rzka a analýzy

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

Renáta Bednárová STATISTIKA PRO EKONOMY

Renáta Bednárová STATISTIKA PRO EKONOMY Renáta Bednárová STATISTIKA PRO EKONOMY ZÁKLADNÍ STATISTICKÉ POJMY Statistika Statistický soubor Statistická jednotky Statistický znak STATISTIKA Vědní obor, který se zabývá hromadnými jevy Hromadné jevy

Více

2. Bodové a intervalové rozložení četností

2. Bodové a intervalové rozložení četností . Bodové a intervalové rozložení četností (Jak získat informace z datového souboru?) Po prostudování této kapitoly budete umět: konstruovat diagramy znázorňující rozložení četností vytvářet tabulky četností

Více

Spojité regulátory - 1 -

Spojité regulátory - 1 - Spojté regulátory - 1 - SPOJIÉ EGULÁOY Nespojté regulátory mají většnou jednoduchou konstrukc a jsou levné, ale jsou nevhodné tím, že neudržují regulovanou velčnu přesně na žádané hodnotě, neboť regulovaná

Více

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT Mlan Meloun Unverzta Pardubce, Čs. Legí 565, 53 10 Pardubce, mlan.meloun@upce.cz 1. Obecný postup analýzy jednorozměrných dat V prvním kroku se v

Více

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE STATISTIKA 1 Adam Čabla Katedra statistiky a pravděpodobnosti VŠE KONTAKTY WWW: sites.google.com/site/adamcabla E-mail: adam.cabla@vse.cz Telefon: 777 701 783 NB367 na VŠE, konzultační hodiny: Pondělí

Více

přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech.

přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech. 3 Grafické zpracování dat Grafické znázorňování je velmi účinný způsob, jak prezentovat statistické údaje. Grafy nejsou tak přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých

Více

Analýza závislosti veličin sledovaných v rámci TBD

Analýza závislosti veličin sledovaných v rámci TBD Analýza závslost velčn sledovaných v rámc BD Helena Koutková Vysoké učení techncké v Brně, Fakulta stavební, Ústav matematky a deskrptvní geometre e-mal: koutkovah@fcevutbrcz Abstrakt Příspěvek se zabývá

Více

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy TESTOVÁNÍ HYPOTÉZ RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevl jsem pravdu! ale raděj: Objevl jsem jednu z pravd! Chall Gbran Testování hypotéz

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Úvod Terminologie Dělení Princip ID3 C4.5 CART Shrnutí. Obsah přednášky

Úvod Terminologie Dělení Princip ID3 C4.5 CART Shrnutí. Obsah přednášky Obsah přednášky. Úvod. Termnologe 3. Základní dělení 4. Prncp tvorby, prořezávání a použtí RS 5. Algortmus ID3 6. C4.5 7. CART 8. Shrnutí A L G O RI T M Y T E O R I E Stromové struktury a RS Obsah knhy

Více

PODKLADY PRO PRAKTICKÝ SEMINÁŘ PRO UČITELE VOŠ. Logaritmické veličiny používané pro popis přenosových řetězců. Ing. Bc. Ivan Pravda, Ph.D.

PODKLADY PRO PRAKTICKÝ SEMINÁŘ PRO UČITELE VOŠ. Logaritmické veličiny používané pro popis přenosových řetězců. Ing. Bc. Ivan Pravda, Ph.D. PODKLADY PRO PRAKTICKÝ SEMIÁŘ PRO ČITELE VOŠ Logartmcké velčny používané pro pops přenosových řetězců Ing. Bc. Ivan Pravda, Ph.D. ATOR Ivan Pravda ÁZEV DÍLA Logartmcké velčny používané pro pops přenosových

Více

10. N á h o d n ý v e k t o r

10. N á h o d n ý v e k t o r 10. N á h o d n ý v e k t o r 10.1. Definice: Náhodný vektor. Uspořádanou n tici (X 1, X 2,..., X n ) náhodných veličin X i, 1 i n, nazýváme náhodným vektorem. Poznámka: Pro jednoduchost budeme zavádět

Více

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}. 5. Náhodná veličina Poznámka: Pro popis náhodného pokusu jsme zavedli pojem jevového pole S jako množiny všech možných výsledků a pravděpodobnost náhodných jevů P jako míru výskytů jednotlivých výsledků.

Více

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla KOMPLEXNÍ ČÍSLA Příklad 1 Řešte na množně reálných čísel rovnc: x + = 0. x = Rovnce nemá v R řešení. Taková jednoduchá rovnce a nemá na množně reálných čísel žádné řešení! Co s tím? Zavedeme tzv. magnární

Více

8. Normální rozdělení

8. Normální rozdělení 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá

Více

2.5. MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC

2.5. MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC 25 MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC V této kaptole se dozvíte: jak lze obecnou soustavu lneárních rovnc zapsat pomocí matcového počtu; přesnou formulac podmínek řeštelnost soustavy lneárních rovnc

Více

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10 SIMULACE numercké řešení dferencálních rovnc smulační program dentfkace modelu Numercké řešení obyčejných dferencálních rovnc krokové metody pro řešení lneárních dferencálních rovnc 1.řádu s počátečním

Více

Staré mapy TEMAP - elearning

Staré mapy TEMAP - elearning Staré mapy TEMAP - elearnng Modul 4 Kartometrcké analýzy Ing. Markéta Potůčková, Ph.D., 2013 Přírodovědecká fakulta UK v Praze Katedra aplkované geonformatky a kartografe Kartometre a kartometrcké vlastnost

Více

radiační ochrana Státní úřad pro jadernou bezpečnost

radiační ochrana Státní úřad pro jadernou bezpečnost Státní úřad pro jadernou bezpečnost radační ochrana DOPORUČENÍ Měření a hodnocení obsahu přírodních radonukldů ve vodě dodávané k veřejnému zásobování ptnou vodou Rev. 1 SÚJB únor 2012 Předmluva Zákon

Více

í I - 13 - Průchod a rozptyl záření gama ve vrstvách materiálu Prof. Ing. J. Šeda, DrSc. KDAIZ - PJPI

í I - 13 - Průchod a rozptyl záření gama ve vrstvách materiálu Prof. Ing. J. Šeda, DrSc. KDAIZ - PJPI - 13 - í Průchod a rozptyl záření gama ve vrstvách materálu Prof. ng. J. Šeda, DrSc. KDAZ - PJP Na našem pracovšt byl vypracován program umožňující modelovat průchod záření gama metodou Monte Carlo, homogenním

Více

FYZIKA I. Pohybová rovnice. Prof. RNDr. Vilém Mádr, CSc. Prof. Ing. Libor Hlaváč, Ph.D. Doc. Ing. Irena Hlaváčová, Ph.D. Mgr. Art.

FYZIKA I. Pohybová rovnice. Prof. RNDr. Vilém Mádr, CSc. Prof. Ing. Libor Hlaváč, Ph.D. Doc. Ing. Irena Hlaváčová, Ph.D. Mgr. Art. VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ FYZIKA I Pohybová rovnce Prof. RNDr. Vlém Mádr, CSc. Prof. Ing. Lbor Hlaváč, Ph.D. Doc. Ing. Irena Hlaváčová, Ph.D. Mgr. Art. Dagmar Mádrová

Více

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2 Dokumentace k projektu pro předměty IZP a IUS Iterační výpočty projekt č.. lstopadu 1 Autor: Mlan Setler, setl1@stud.ft.vutbr.cz Fakulta Informačních Technologí Vysoké Učení Techncké v Brně Obsah 1 Úvod...

Více

Škály podle informace v datech:

Škály podle informace v datech: Škály podle informace v datech: Různé typy dat znamenají různou informaci, resp. různé množství informace Data nominální Rovná se? x 1 = x 2 Data ordinální Větší, menší? x 1 < x 2 Data intervalová O kolik?

Více

9.12.2009. Metody analýzy rizika. Předběžné hodnocení rizika. Kontrolní seznam procesních rizik. Bezpečnostní posudek

9.12.2009. Metody analýzy rizika. Předběžné hodnocení rizika. Kontrolní seznam procesních rizik. Bezpečnostní posudek 9.2.29 Bezpečnost chemckých výrob N Petr Zámostný místnost: A-72a tel.: 4222 e-mal: petr.zamostny@vscht.cz Analýza rzka Vymezení pojmu rzko Metody analýzy rzka Prncp analýzy rzka Struktura rzka spojeného

Více

ANALÝZA A KLASIFIKACE DAT

ANALÝZA A KLASIFIKACE DAT ANALÝZA A KLASIFIKACE DAT prof. Ing. Jří Holčík, CSc. INVESTICE Insttut DO bostatstky ROZVOJE VZDĚLÁVÁNÍ a analýz IV - pokračování KLASIFIKACE PODLE MINIMÁLNÍ VZDÁLENOSTI METRIKY PRO URČENÍ VZDÁLENOSTI

Více

Základy popisné statistiky

Základy popisné statistiky Kapitola Základy popisné statistiky Všude kolem nás se setkáváme se shromažd ováním velkého počtu údajů o nejrůznějších objektech Mohou to být národohospodářské údaje o vývoji ekonomiky dané země sbírané

Více

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,

Více

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl

Více

Pracovní list č. 3: Pracujeme s kategorizovanými daty

Pracovní list č. 3: Pracujeme s kategorizovanými daty Pracovní lt č. 3: Pracujeme kategorzovaným daty Cíl cvčení: Tento pracovní lt je určen pro cvčení ke 3. a. přednášce předmětu Kvanttatvní metody B (.1 Třídění tattckých dat a. Číelné charaktertky tattckých

Více

6 LINEÁRNÍ REGRESNÍ MODELY

6 LINEÁRNÍ REGRESNÍ MODELY 1 6 LINEÁRNÍ REGRESNÍ MODELY Př budování regresních modelů se běžně užívá metody nejmenších čtverců. Metoda nejmenších čtverců poskytuje postačující odhady parametrů jenom př současném splnění všech předpokladů

Více

URČOVÁNÍ TRENDŮ A JEJICH VÝZNAM PRO EKONOMIKU

URČOVÁNÍ TRENDŮ A JEJICH VÝZNAM PRO EKONOMIKU URČOVÁNÍ TRENDŮ A JEJICH VÝZNAM PRO EKONOMIKU Rudolf Kampf ÚVOD Pro marketng, management a vůbec pro člověka je jstě důležté vědět, jak se bude vyvíjet stuace v ekonomce, stuace v určtém státě z hledska

Více

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2 Závěrečná zpráva o výsledcích expermentu shodnost ZČB 2013/2 Obsah Úvod a důležté kontakty... 2 Postupy statstcké analýzy expermentu shodnost... 4 2.1 Numercký postup zjšťování odlehlých hodnot... 4 2.1.1

Více

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522 Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 145 UNCERTAINTY OF DETEMINATION OF THE AUTO-IGNITION TEMPERATURE OF FLAMMABLE GASES OR VAPOURS

Více

ČVUT FEL. X16FIM Finanční Management. Semestrální projekt. Téma: Optimalizace zásobování teplem. Vypracoval: Marek Handl

ČVUT FEL. X16FIM Finanční Management. Semestrální projekt. Téma: Optimalizace zásobování teplem. Vypracoval: Marek Handl ČVUT FEL X16FIM Fnanční Management Semestrální projekt Téma: Optmalzace zásobování teplem Vypracoval: Marek Handl Datum: květen 2008 Formulace úlohy Pro novou výstavbu 100 bytových jednotek je třeba zvolt

Více

Transformace dat a počítačově intenzivní metody

Transformace dat a počítačově intenzivní metody Transformace dat a počítačově ntenzvní metody Jří Mltký Katedra textlních materálů, Textlní fakulta, Techncká unversta v Lberc, Lberec, e- mal jr.mltky@vslb.cz Mlan Meloun, Katedra analytcké cheme, Unversta

Více

Osově namáhaný prut základní veličiny

Osově namáhaný prut základní veličiny Pružnost a pevnost BD0 Osově namáhaný prut základní velčny ormálová síla půsoící v průřezu osově namáhaného prutu se získá ntegrací normálového napětí po ploše průřezu. da A Vzhledem k rovnoměrnému rozložení

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních

Více

Cykly a pole 103. 104. 105. 106. 107. 108. 109. 110. 111. 112. 113. 114. 115. 116.

Cykly a pole 103. 104. 105. 106. 107. 108. 109. 110. 111. 112. 113. 114. 115. 116. Cykly a pole Tato část sbírky je tvořena dalšími úlohami na práci s cykly. Na rozdíl od předchozího oddílu se zde již v řešeních úloh objevuje více cyklů, ať už prováděných po sobě nebo vnořených do sebe.

Více

Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička

Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady Mlan Růžčka mechanka.fs.cvut.cz mlan.ruzcka@fs.cvut.cz Analýza dynamckých zatížení Harmoncké zatížení x(t) přes soubor

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

permutace, popisující nějaké symetrie, je i π permutace, popisující nějakou symetrii.

permutace, popisující nějaké symetrie, je i π permutace, popisující nějakou symetrii. DSM Cv Pólyova věta Budeme se zabývat objekty (na množně X - to jsou vrcholy těchto objektů) s různým prvky symetre (například to mohou být různé brože, tsky, ale také strukturní vzorce různých chemckých

Více

EKONOMICKO-MATEMATICKÉ METODY

EKONOMICKO-MATEMATICKÉ METODY . přednáška EKONOMICKO-MATEMATICKÉ METODY Ekonomcko matematcké metody (též se užívá název operační analýza) sou metody s matematckým základem, využívané především v ekonomcké oblast, v oblast řízení a

Více

u (x i ) U i 1 2U i +U i+1 h 2. Na hranicích oblasti jsou uzlové hodnoty dány okrajovými podmínkami bud přímo

u (x i ) U i 1 2U i +U i+1 h 2. Na hranicích oblasti jsou uzlové hodnoty dány okrajovými podmínkami bud přímo Metoda sítí základní schémata h... krok sítě ve směru x, tj. h = x x q... krok sítě ve směru y, tj. q = y j y j τ... krok ve směru t, tj. τ = j... hodnota přblžného řešení v uzlu (x,y j ) (Possonova rovnce)

Více

Aplikace simulačních metod ve spolehlivosti

Aplikace simulačních metod ve spolehlivosti XXVI. ASR '2001 Semnar, Instruments and Control, Ostrava, Aprl 26-27, 2001 Paper 40 Aplkace smulačních metod ve spolehlvost MARTINEK, Vlastml Ing., Ústav automatzace a nformatky, FSI VUT v Brně, Techncká

Více

Neřešené příklady k procvičení

Neřešené příklady k procvičení Vysoká škola báňská - Techncká unverzta Ostrava Fakulta elektrotechnky a nformatky Katedra aplkované matematky Neřešené příklady k procvčení Lenka Šmonová Ostrava, 2006 Následující sbírka neřešených příkladů

Více

Výsledný graf ukazuje následující obrázek.

Výsledný graf ukazuje následující obrázek. Úvod do problematiky GRAFY - SPOJNICOVÝ GRAF A XY A. Spojnicový graf Spojnicový graf používáme především v případě, kdy chceme graficky znázornit trend některé veličiny ve zvoleném časovém intervalu. V

Více

7. Analýza rozptylu jednoduchého třídění

7. Analýza rozptylu jednoduchého třídění 7. nalýza rozptylu jednoduchého třídění - V této kaptole se budeme zabývat vztahem mez znaky kvanttatvním (kolk) a kvaltatvním (kategorálním, jaké jsou) Doposud jsme schopn u nch hodnott: - podmíněné charakterstky

Více

Ing. Barbora Chmelíková 1

Ing. Barbora Chmelíková 1 Numercká gramotnost 1 Obsah BUDOUCÍ A SOUČASNÁ HODNOTA TYPY ÚROČENÍ JEDNODUCHÉ vs SLOŽENÉ ÚROČENÍ JEDNODUCHÉ ÚROČENÍ SLOŽENÉ ÚROČENÍ FREKVENCE ÚROČENÍ KOMBINOVANÉ ÚROČENÍ EFEKTIVNÍ ÚROKOVÁ MÍRA SPOJITÉ

Více

Výslednice, rovnováha silové soustavy.

Výslednice, rovnováha silové soustavy. Výslednce, ovnováha slové soustavy. Základy mechanky, 2. přednáška Obsah přednášky : výslednce a ovnováha slové soustavy, ovnce ovnováhy, postoová slová soustava Doba studa : as 1,5 hodny Cíl přednášky

Více

NÁHODNÁ VELIČINA. 3. cvičení

NÁHODNÁ VELIČINA. 3. cvičení NÁHODNÁ VELIČINA 3. cvičení Náhodná veličina Náhodná veličina funkce, která každému výsledku náhodného pokusu přiřadí reálné číslo. Je to matematický model popisující více či méně dobře realitu, který

Více

3. Reálná čísla. většinou racionálních čísel. V analytických úvahách, které praktickým výpočtům

3. Reálná čísla. většinou racionálních čísel. V analytických úvahách, které praktickým výpočtům RACIONÁLNÍ A IRACIONÁLNÍ ČÍSLA Význačnými množinami jsou číselné množiny K nejvýznamnějším patří množina reálných čísel, obsahující jako podmnožiny množiny přirozených, celých, racionálních a iracionálních

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická

Více

POLYMERNÍ BETONY Jiří Minster Ústav teoretické a aplikované mechaniky AV ČR, v. v. i.

POLYMERNÍ BETONY Jiří Minster Ústav teoretické a aplikované mechaniky AV ČR, v. v. i. Odborná skupna Mechanka kompoztních materálů a konstrukcí České společnost pro mechanku s podporou frmy Letov letecká výroba, s. r. o. a Ústavu teoretcké a aplkované mechanky AV ČR v. v.. Semnář KOMPOZITY

Více