Tomáš Karel LS 2012/2013
Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není v nich obsaženo zdaleka všechno, co byste měli umět. Dalším studijním materiálem je učebnice, cvičebnice a také poznámky z přednášek a cvičení! Tomáš Karel - 4ST201 15.10.2013 2
cv. rogram cvičení 1. Úvod, popisná statistika 2. opisná statistika 3. Míry variability, pravděpodobnost 4. ravděpodobnost, náhodné veličiny a jejich charakteristiky 5. ravděpodobnostní rozdělení 6. TEST, odhady parametrů 7. Testování hypotéz 8. Chí kvadrát test dobré shody, kontingenční tabulky, ANOVA 9. Regrese 10. Regrese, korelace 11. TEST, časové řady (bazické a řetězové indexy 12. Časové řady 13. Indexní analýza
Absolutní Rozptyl kvadratická odchylka od průměru (Klasický rozptyl známe všechny hodnoty všech jednotek 1 s (x x n 2 2 x i n i 1 (v každém městě je pouze 10 obyvatel Výběrový rozptyl známe pouze některé hodnoty ze souboru n 2 1 2 s x (xi x n1 i 1 x x (v každém městě je víc jak 10 obyvatel Směrodatná odchylka je druhá odmocnina z rozptylu s nebo s Variační rozpětí - nejvyšší hodnota mínus nejnižší Relativní Variační koeficient směrodatná odchylka dělená průměrem R x x max min s s x x x V x,nebo V x x
Máme informace o skupinových četnostech skupinových průměrech skupinových rozptylech Celkový průměr x k n i i1 k i1 x n i i n i x i 2 s ix Celkový rozptyl s s s 2 2 2 x x s k 2 (xi x ni 2 i1 x k i1 n Meziskupinová variabilita i s k 2 i1 k i1 s n ix n Vnitroskupinová variabilita i i
s okud místo skupinových absolutních četností ni máme k dispozici skupinové relativní četnosti p i, používáme pro výpočet celkového rozptylu místo vzorce k k 2 (xi x ni sixni 2 i1 i1 x k k n i i1 i1 n i vzorec k k 2 2 2 2 x i i ix i i1 i1 s (x x p s p Výpočet rozptylu z variačního koeficientu a průměru s (V x 2 2 x x resp. sm. odchylky z variačního koeficintu a průměru s x V x x
Obchodní řetězec odebírá určitý výrobek, jehož cena v průběhu roku sezónně kolísá, od dvou stálých dodavatelů (A a B. růměrná cena za celý rok od dodavatele A je 9 CZK, její směrodatná odchylka činí 2 CZK, od dodavatele A se nakoupilo 1000 kusů. U dodavatele B činí průměrná cena 10 CZK při směrodatné odchylce 1 CZK, nákup od dodavatele B byl 4000 kusů. Určete a. variační koeficient vyjadřující variabilitu kolísání nákupní ceny během roku souhrnně za oba dva dodavatele dohromady. b. zjistěte, zda se na celkové variabilitě nákupní ceny větší měrou podílí průběžné sezónní kolísání cen výrobku u jednotlivých dodavatelů v rámci roku nebo zda jsou důležitější rozdíly mezi průměrnými cenami jednotlivých dodavatelů.
Výrobce A 9 1 000 2 2 =4 Výrobce B 10 4 000 1 2 =1 xi 2 ni s ix Celkový průměr: Meziskupinová variabilita: Vnitroskupinová variabilita: Celkový rozptyl: s n x n x 1000 9 400010 n n 5000 1 1 2 2 x 9,8 1 2 k 2 (xi x ni 2 i1 x k i1 i 2 2 (9 9,8 1000 (10 9,8 4000 640 160 8 1000 4000 5000 50 n s k 2 sixni 2 2 2 1000 1 4000 8 5000 5 n 2 i1 k i1 Variační koeficient: i 2 2 2 8 8 88 sx smeziskup. svnitroskup. sx s 1, 76 50 5 50 s 1,76 x 9,8 x Vx 0,135
B zjistěte, zda se na celkové variabilitě nákupní ceny větší měrou podílí průběžné sezónní kolísání cen výrobku u jednotlivých dodavatelů v rámci roku nebo zda jsou důležitější rozdíly mezi průměrnými cenami jednotlivých dodavatelů. 8 8 protože je s s 5 50 2 2 x Vnitroskupinová variabilita je větší, než meziskupinová => Sezónní kolísání cen je důležitější
Soubor o 6 hodnotách má průměr 12 a rozptyl 4,667. Jak se změní průměr a rozptyl souboru, pokud do souboru přibude hodnota 15?
x 12 starý s 4, 667 2 x starý 6x 15 612 15 starý xnový 12, 43 7 7 7 6 2 2 2 xi xi 15 2 i1 2 i1 2 sx nový xnový 12, 43 7 7 2 2 6 (4, 667 12 15 2 12,43 5,07 7
Náhodný pokus pokus, jehož výsledek se i při dodržení podmínek mění, tj. jehož výsledek závisí na náhodě (např. hod kostkou. Náhodný jev výsledek náhodného pokusu (např. na kostce padla šestka. Náhodný jev budeme značit většinou velkými písmeny, např. A, B atd. ravděpodobnost náhodného jevu A budeme označovat jako (A. Jev jistý (označíme např. jako nebo E Jev, jež nastane vždy, tj. při každém opakování náhod. pokusu (např. na kostce padne nějaké číslo z 1, 2, 3, 4, 5, 6, ( =1 Jev nemožný (označíme jako Ø Jev, jež nikdy nenastane (např. na kostce padne číslo 7, (Ø = 0 Elementární jev nelze vyjádřit jako sjednocení (viz. další slide dvou jevů, jež jsou různé od tohoto jevu. Doplňkový (opačný jev k jevu A (označíme A Jev jež nastane právě, když nenastane jev A, ( A = 1 - ( A
Jednou hodíme klasickou hrací kostkou. Znázorněte pomocí Vennových diagramů následující jevy: a jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého počtu teček b jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého počtu teček dělitelných třemi c jev C spočívající v padnutí šesti teček, jestliže jev A znamená padnutí sudého počtu teček a jev B padnutí pěti nebo šesti teček d jev D spočívající v padnutí více než šesti teček (jev jistý značíme E a jev nemožný Ø
a jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého počtu teček b jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého počtu teček dělitelných třemi
c jev C spočívající v padnutí šesti teček, jestliže jev A znamená padnutí sudého počtu teček a jev B padnutí pěti nebo šesti teček d jev D spočívající v padnutí více než šesti teček
KLASICKÁ DEFINICE RAVDĚODOBNOSTI říká, že pravděpodobnost nějakého jevu je rovna podílu počtu výsledků, jež jsou danému jevu příznivé, ku celkovému (konečnému počtu výsledků, jež jsou apriori stejně pravděpodobné. STATISTICKÁ DEFINICE RAVDĚODOBNOSTI říká, že pravděpodobnost nějakého jevu je relativní četností výskytu tohoto jevu v souboru o velké velikosti (v limitě blížící se k nekonečnu.
říklad nezávislých jevů při hodu dvěma kostkami: A = na první kostce padne 1, B = na druhé kostce padne 1. říklad závislých jevů při hodu dvěma kostkami: A = na první kostce padne 1, B = součet na obou kostkách bude 10. Jev je jevem nemožným (nemůže na první kostce padnou 1 a zároveň být součet 10, proto: ( ( ( B A B A 36 1 6 1 6 1 ( ( ( B A B A 36 3 6 1 ( ( ( 0 B A B A
plocha průniku je při součtu (A+(B započítána 2x, proto jí musíme 1x odečíst pokud jevy A a B nemají průnik, nazýváme je neslučitelné (disjunktní pokud jevy A a B jsou neslučitelné, přechází pravidlo o sčítání. na: ( ( ( ( B A B A B A ( ( ( B A B A
říklad neslučitelných jevů při hodu jednou kostkou: A = padne liché číslo B = padne sudé číslo 3 3 (A B (A (B 1 6 6 říklad jevů, které nejsou neslučitelné při hodu jednou kostkou: A = padne některé z čísel 1, 2, 3 nebo 4 B = padne 4, 5 nebo 6 4 3 1 (A B (A (B (A B 1 6 6 6
Jaká je pravděpodobnost, že při hodu dvěma kostkami padne: a na obou kostkách šestka b alespoň jedna šestka c právě jedna šestka d žádná šestka e na obou kostkách sudé číslo Jev A... padla šestka na první kostce Jev B... padla šestka na druhé kostce Jev C... padlo sudé číslo na první kostce Jev D... padlo sudé číslo na druhé kostce
Z publikací Českého statistického úřadu byl převzat počet narozených chlapců a děvčat v letech 1990 1997. Vypočítejte přibližnou pravděpodobnost, že narozené dítě bude chlapec a přibližnou pravděpodobnost, že narozené dítě bude děvče. Absolutní četnosti Rok Chlapci Děvčata Celkem 1990 67 234 63 860 131 094 1991 66 895 62 955 129 850 1992 62 946 59 196 122 142 1993 62 362 59 108 121 470 1994 54 887 52 028 106 915 1995 49 570 46 827 96 397 1996 46 605 44 158 90 763 1997 46 705 44 225 90 930 Celkem 457 204 432 357 889 561
(chlapec 457 204 (chlapec 0,514 (celkem 889 561 (dívka 432 357 (dívka 0, 486 (celkem 889 561
Na viděnou na příštím cvičení. okud jste něčemu nerozuměli, nebo Vám je něco nejasné, zastavte se v konzultačních hodinách nebo mi pošlete e-mail. Rád Vám nejasnosti vysvětlím. Email: tomas.karel@vse.cz