Tomáš Karel LS 2012/2013
Doplňkový materiál ke cvičení ze 4ST201. Na případné faktické chyby v této prezentaci mě prosím upozorněte. Děkuji Tyto slidy berte pouze jako doplňkový materiál není v nich obsaženo zdaleka všechno, co byste měli umět. Dalším studijním materiálem je také učebnice, cvičebnice a poznámky z přednášek a cvičení! 25.9.2013 2
Ing. Tomáš Karel email: tomas.karel@gmail.com místnost: NB171 A konzultační hodiny: čtvrtek 10.15 12.15) (jinak dle dohody) materiály ke cvičení: Průběžně na www.tomaskarel.cz/vse web Katedry statistiky a pravděpodobnosti: http://kstp.vse.cz/ web předmětu: http://statistika.vse.cz/predmety/4st201.php 25.9.2013 3
Statistika pro ekonomy Hindls R., Hronová S., Seger J., Fischer,J. (1. 8. vydání) Statistika v příkladech Marek L. a kolektiv Seznam kapitol a příkladů z učebnice a cvičebnice, které jsou náplní kurzu 4ST201: http://statistika.vse.cz/download/materialy/4st201_co_se_ucit.pdf 25.9.2013 4
kstp.vse.cz statistika.vse.cz obsah přednášek a látka ke studiu požadavky k ukončení předmětu Vzorce: http://statistika.vse.cz/download/materialy/4st201_vzorce.pdf Tabulky: http://statistika.vse.cz/download/materialy/tabulky.pdf Vzorce a tabulky (bez individuálních úprav) z těchto webových stránek LZE používat jak na přůběžných testech na cvičení, tak i na závěrečném zkouškovém testu. Vzorce a tabulky si proto prosím vytiskněte a noste je prosím na cvičení, ať se s nimi naučíte pracovat. 25.9.2013 5
1. průběžný test 20b 2. průběžný test 20b Celkem ze cvičení 40b Zkouškový test Celkem - maximum 60 b 100 b Hodnocení: 90 100% => 1 75 89% => 2 60 74% => 3 50 59% => 4+ pod 50% => 4 1. test - 6. týden 2. test 11. týden Za každý ze dvou průběžných testů lze získat maximálně 20 bodů. Celkem lze tedy získat maximálně 40 bodů ze cvičení. Na každý průběžný test je pouze jeden pokus. Nebudete-li se moci testu zúčastnit, je třeba donést omluvenku studijní referentce a budete psát test náhradní. Neomluvená absence na testu znamená 0 bodů z daného testu. Možné minimum ze cvičení je 16 b!!! 25.9.2013 6
30 minut (na konci cvičení) pouze početní příklady Možnost využití počítače, kalkulačky a vzorců, tabulek 1. test - 6. týden (popř. 7. týden) 2. test 11. týden (popř. 12. týden) 60 minut, 60 bodů ve zkouškovém období obsahuje teorii i příklady teorie (50% - 30b) zaškrtávací (1 správná odpověď, 5 4b) (pozn. správná odpověď +4b, špatná odpověď -2b, žádná odpověď 0b) výroky (ano ne, 5 2b) (pozn. správná odpověď +2b, špatná odpověď -2b, žádná odpověď 0b) z teoretické části není možné získat záporný počet bodů, minimum je nula příklady (50% - 30b) 3 příklady po 10 bodech 25.9.2013 7
statistika má v dnešní době četná uplatnění v mnoha odvětvích, včetně ekonomie vzhledem k možné rozsáhlosti vstupních dat a náročnosti operací spojených s jejich klasifikací a analýzou je v dnešní době často využíván statistický software: SAS R Statistica Statgraphics SPSS Matlab Na tomto cvičení MS EXCEL běžnou součástí většiny systémů MS Windows 25.9.2013 8
1. Úvod, popisná statistika 2. Popisná statistika 3. Míry variability, pravděpodobnost 4. Pravděpodobnost, náhodné veličiny a jejich charakteristiky 5. Pravděpodobnostní rozdělení 6. TEST, odhady parametrů 7. Testování hypotéz 8. Chí kvadrát test dobré shody, kontingenční tabulky, ANOVA 9. Regrese 10. Regrese, korelace 11. TEST, časové řady (bazické a řetězové indexy) 12. Časové řady 13. Indexní analýza 25.9.2013 9
kombinační čísla n k ( n n! k)! k! Využití např. počet pravděpodobnosti (binomické rozdělení další cvičení) kombinační číslo en nad ká vyjadřuje, kolik různých k-tic lze vytvořit z n prvků, přičemž na pořadí prvků v dané k-tici nezáleží a každý prvek se v dané k-tici smí vyskytnout maximálně jednou n! faktoriál, na kalkulačce x! 25.9.2013 10
Vypočítejte: 8 3 10 9?? 25.9.2013 11
V populárním seriálu The Big Bang Theory (Teorie velkého třesku) jedna z hlavních postav tohoto seriálu, Sheldon Cooper, uvádí rozšíření tradiční hry kámen nůžky papír o další dva symboly tapíra a Spocka (postava ze Star Treku) celkem na pětici symbolů kámen nůžky papír tapír Spock http://www.youtube.com/watch?v=_f0pszfyqqi Kolik musí být ve hře s pěti symboly stanoveno pravidel, podle kterých se vůči sobě jednotlivé symboly chovají? Např. 1) Papír balí kámen, 2) nůžky stříhají papír 25.9.2013 12
Statistické znaky kvantitativní kvalitativní ordinální (pořadové) měřitelné alternativní (binomické) množné 25.9.2013 13
Pomocí metody dotazování získáme údaje o 10 studentech v této třídě: pohlaví studenta (x 1 ) věk studenta (x 2 ) studovaná fakulta (x 3 ) semestr (x 4 ) založení facebook účtu (x 5 ) počet přátel na facebooku (x 6 ) 25.9.2013 14
Získaná data uspořádáme do přehledné tabulky tzv. datové matice (viz soubor cviceni_1.xlsx na ISISu v sekci dokumenty ) číslo pohlaví věk fakulta semestr facebook Fb přátelé i x1 x2 x3 x4 x5 x6 1 2 3 4 5 6 7 8 9 10 25.9.2013 15
1) Určete typy proměnných x 1 x 6 dle výše uvedeného schématu na jednom z předchozích slidů x 1 pohlaví studenta x 2 věk studenta x 3 studovaná fakulta x 4 semestr ve kterém jste si zapsali tento předmět x 5 založení facebooku x 6 počet přátel na Vašem facebooku 2) Pro proměnnou x 2 věk studenta sestrojte tabulku rozdělení četností (absolutních, relativních, kumulativních absolutních a kumulativních relativních) 25.9.2013 16
absolutní četnosti n i, i 1,2,..., k relativní četnosti p i ni n kumulativní absolutní četnosti platí: k i1 n i kumulativní relativní četnosti n n p 1n2 1 p2...... platí: k i1 p i 1 25.9.2013 17
3) Sestrojte tabulku rozdělení četností pro proměnnou x 6 počet facebookových přátel proměnná x 4 nabývá mnoha obměn (tabulka četností i graf by nevypadaly dobře) vhodnější je intervalové rozdělení četností musíme zvolit vhodný počet a šířku intervalu 25.9.2013 18
Sturgesovo pravidlo pro počet intervalů šířka jednoho intervalu: variační rozpětí: R x max x min 25.9.2013 19
průměr (aritmetický, geometrický, harmonický, kvadratický) modus = hodnota s nejvyšší četností a%-ní kvantil = dělí soubor uspořádaný podle velikosti (od nejnižších hodnot po nejvyšší) na prvních a% hodnot a zbývajících (100-a)% medián = prostřední hodnota v souboru uspořádaném podle velikosti = 50% kvantil dolní kvartil = 25% kvantil horní kvartil = 75% kvantil 25.9.2013 20
25.9.2013 21
Jaký je průměrný počet facebookových přátel? (vypočtěte dvojím způsobem - nejdříve ze základní tabulky a poté z tabulky rozdělení četností) ze základní tabulky (prostý aritmetický průměr) x n i 1 n x i z tabulky rozdělení četností (vážený aritmetický průměr) x k i1 k i1 x i n n i i 25.9.2013 22
Závodní okruh Sosnová má délku základní trasy 1,075 km. Testovací závodník projel tento okruh celkem třikrát. V prvním kole byla jeho průměrná rychlost 60 km/h, v druhém kole už 72 km/h a ve třetím kole dosáhl průměrné rychlosti 80 km/h. Vypočítejte průměrnou rychlost jezdce za celou dobu jízdy, definovanou jako podílcelkové dráhy za celkový čas www.autodrom.cz s = 1,075 km 25.9.2013 23
Pro proměnnou x 2 - věk určete následující kvantily: a) medián x 0,5 b) horní kvartil x 0,25 c) dolní kvartil x 0,75 25.9.2013 24
DÚ: Učebnice, cvičebnice příklady 25.9.2013 25