Věk 1. 20 2. 20 3. 21 4. 22 5. 22 6. 23 7. 23 8. 24 9. 24 10. 24 Obecý vzorec pro výpočet kvatlů sudé : Dolí kvartl: p z 100 p p 1 100 p p 25 25 zp 1 10 zp 10 1 100 100 100 100 2,5 z 2,5 1 21 p 0,25 (3) Horí kvartl: p p 25 25 zp 1 10 zp 10 1 100 100 100 100 7,5 z 7,5 1 24 p 0,75 (8)
Tomáš Karel LS 2012/2013
Doplňkový materál ke cvčeí z předmětu 4ST201. Na případé faktcké chyby v této presetac mě prosím upozorěte. Děkuj. Tyto sldy berte pouze jako doplňkový materál eí v ch obsažeo zdaleka všecho, co byste měl umět. Dalším studjím materálem je učebce, cvčebce a také pozámky z předášek a cvčeí! Tomáš Karel - 4ST201 3.10.2013 3
cv. Program cvčeí 1. Úvod, popsá statstka 2. Popsá statstka 3. Míry varablty, pravděpodobost 4. Pravděpodobost, áhodé velčy a jejch charakterstky 5. Pravděpodobostí rozděleí 6. TEST, odhady parametrů 7. Testováí hypotéz 8. Chí kvadrát test dobré shody, kotgečí tabulky, ANOVA 9. Regrese 10. Regrese, korelace 11. TEST, časové řady (bazcké a řetězové dey) 12. Časové řady 13. Ideí aalýza
Kombačí čísla Četost Absolutí Relatví Kumulatví Charakterstky úrově Průměr Prostý artmetcký Vážeý artmetcký Harmocký/vážeý harmocký Medá Kvartly k, 1,2,..., k! ( k)! k! 1 1 1 k... p p... 1 2 -absolutí 1 p 1 2 -relatví k 1 k 1 k 1 p 1 medá 21; 21; 22; 22; 22; 23; 24 1. kvartl 2.kvartl
Prostý artmetcký průměr Př zpracováí stude o průměré výš měsíčích příjmů v České republce jsme získal data celkem od 5-t tazatelů. Každý z těchto pět souborů dat obsahoval údaje o deset statstckých jedotkách (respodetech - těch, kteří odpověděl). 1 soubor 1. 2. 3. 4. 5. Počet respodetů 10 10 10 10 10 Průměr v souboru (ts. Kč) 18,5 21,2 24,2 19 26,2 Vypočítejte celkovou průměrou hodotu ze všech získaých dat.
soubor 1. 2. 3. 4. 5. Počet respodetů 10 10 10 10 10 Průměr v souboru (ts. Kč) 18,5 21,2 24,2 19 26,2 Prostý artmetcký průměr 1 18,5 21, 2 24, 2 19 26, 2 109,1 21,82 5 5
Vážeý artmetcký průměr k 1 k 1 Př zpracováí stude o průměré výš měsíčích příjmů v České republce jsme získal data celkem od 5-t tazatelů. Každý z těchto pět souborů dat obsahoval odlšý počet údajů o statstckých jedotkách (respodetech - těch, kteří odpověděl). soubor 1. 2. 3. 4. 5. Počet respodetů 10 13 15 7 5 Průměr v souboru (ts. Kč) 18,5 21,2 24,2 19 26,2 Vypočítejte celkovou průměrou hodotu ze všech získaých dat.
soubor 1. 2. 3. 4. 5. Počet respodetů - 10 13 15 7 5 Průměr v souboru (ts. Kč) 18,5 21,2 24,2 19 26,2 Vážeý artmetcký průměr k 1 18,510 21, 213 24, 215 197 26, 25 1079,9 21, 75 k 10 1315 7 5 50 1
Jak je možé, že průměrá mzda v České republce je 24,5 ts Kč a více jak 60 % obyvatel ČR má plat žší??? Datový soubor od prvího tazatele: respodet 1. 2. 3. 4. 5. 6. 7. 8. 9. 10 průměr příjem 10,5 11 9,5 11,5 15,5 16,5 16 15 16,5 63 18,5 1 10,5 11 9,5 11,5 15,5 16,5 16 15 16,5 63 18,5 10
1) Seřadt podle velkost respodet 3. 1. 2. 4. 8. 5. 7. 6. 9. 10 průměr příjem 9,5 10,5 11 11,5 15 15,5 16 16,5 16,5 63 18,5 medá průměr 63,0... 23,0 22,5 22,0 21,5 21,0 20,5 20,0 19,5 19,0 18,5 18,0 17,5 17,0 16,5 16,0 15,5 15,0 14,5 14,0 13,5 13,0 12,5 12,0 11,5 11,0 10,5 10,0 9,5 9,0 2) Určt prostředí hodotu 15 15,5 2 2 (5) (6) 0,5 15, 25 90% hodot meších ež průměr!!!
1) Seřadt podle velkost respodet 3. 1. 2. 4. 8. 5. 7. 6. 9. 10 průměr příjem 9,5 10,5 11 11,5 15 15,5 16 16,5 16,5 63,1 18,5 medá průměr 63,0... 23,0 22,5 22,0 21,5 21,0 20,5 20,0 19,5 19,0 18,5 18,0 17,5 17,0 16,5 16,0 15,5 15,0 14,5 14,0 13,5 13,0 12,5 12,0 11,5 11,0 10,5 10,0 9,5 9,0 2) Určt 1. kvartl 0,25 3) Určt 3. kvartl 0,75 p p zp 1 0,25 (3) 11 100 100 p p zp 1 0,75 (8) 16,5 100 100 90% hodot meších ež průměr!!!
Modus (modálí hodota) je taková hodota, která je v souboru ejčastěj zastoupea (má ejvětší četost) modus medá průměr 63,0... 23,0 22,5 22,0 21,5 21,0 20,5 20,0 19,5 19,0 18,5 18,0 17,5 17,0 16,5 16,0 15,5 15,0 14,5 14,0 13,5 13,0 12,5 12,0 11,5 11,0 10,5 10,0 9,5 9,0 Průměr 18,5 ts Kč průměrá hodota Modus 16,5 ts Kč ejčastěj zastoupeá hodota Medá 15,25 ts Kč prostředí hodota
Rozptyl směrodatá odchylka varačí koefcet varačí rozpětí Rozklad rozptylu vtroskupový rozptyl mezskupový rozptyl Vlastost rozptylu
Socálí ůžky Představme s dvě městečka v Jhočeském kraj* Levcov a Pravcov V obou městech bylo provedeo šetřeí o průměrém měsíčím příjmu obyvatel. Z výzkumu vyšlo, že v obou městech je průměrý měsíčí příjem stejý a to 20 ts. Kč. Zdá se, že se v průměru se daří obyvatelům obou měst stejě. Pokud se však podíváme a bodový graf podroběj v ěčem se tato města lší. Přestože průměrý příjem jejch obyvatel je stejý. Jak to ale číselě vyjádřt? průměr 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Pravcov 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 průměr 20 ts Kč 20 ts Kč Levcov
Na mulém cvčeí jsme se zabýval měram polohy (průměry, medá, modus), které charakterzovaly hodotovou úroveň souboru, typckou hodotu v souboru apod. Často je však zapotřebí kromě typcké hodotové úrově pozat to, jak moc se jedotlvé hodoty souboru od sebe odlšují (tzv. varabltu souboru Levcov vs. Pravcov). K tomuto účelu slouží právě míry varablty. Abychom zachytl vzájemou odlšost hodot souboru, můžeme studovat apříklad to, jak se jedotlvé hodoty lší od průměru. Abychom dokázal kvatfkovat (číselě vajádřt) tuto vlastost (tj. odlšost hodot souboru od průměru) můžeme zvolt ěkolk růzých přístupů. Můžeme apř. studovat průměrou absolutí odchylku hodot souboru od průměru, ebo průměrou kvadratckou odchylku hodot souboru od průměru apod. Právě průměrá kvadratcká odchylka hodot souboru od průměru je základem defce rozptylu jako jedé z ejvýzamějších měr varablty souboru. Estují však samozřejmě jé míry varablty
Absolutí Rozptyl kvadratcká odchylka od průměru (Klascký) rozptyl záme všechy hodoty všech jedotek 1 s ( ) 2 2 1 (v každém městě je pouze 10 obyvatel) Výběrový rozptyl záme pouze ěkteré hodoty ze souboru (v každém městě je víc jak 10 obyvatel) 2 1 2 s ( ) 1 1 Směrodatá odchylka je druhá odmoca z rozptylu Varačí rozpětí - ejvyšší hodota míus ejžší s ebo s R ma m Relatví Varačí koefcet směrodatá odchylka děleá průměrem s s V,ebo V
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Výběrový Rozptyl: 1 1 s ( ) (9000 20000) (9000 20000)... 2 2 2 2 1 1 10 1 Pravcov 1... (36000 20000) (37000 20000) ( 11000) ( 11000)... 14000 13000 ) 19010 Výběrová směrodatá 9 odchylka: Varačí koefcet: Varačí rozpětí: 2 6 s 13784 s s 19010 13784 V 0, 689 2 2 2 2 2 2 6 R 37000 9000 28000 ma m 20000 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Výběrový Rozptyl: Výběrová směrodatá odchylka: 1 1 s ( ) (18000 20000) (19000 20000)... 2 2 2 2 1 1 10 1 Levcov 2 2 1 2 2 2 2 6... (21000 20000) (22000 20000) ( 2000) ( 1000)... 1000 2000 ) 1,333 10 9 Varačí koefcet: s s 1,333 10 1154 Varačí rozpětí: 2 6 R 22000 18000 4000 ma m s 1154 20000 V 0, 058
Míra varablty Pravcov Levcov Výběrový rozptyl 19010 6 1,33310 6 Výběrová směrodatá odchylka 13 784 1 154 Varačí rozpětí 28 000 4 000 Varačí koefcet 0,689 0,058 Míra úrově (polohy) Pravcov Levcov Průměr 20 000 20 000 Medá 10 000 20 000 Modus 9 000 20 000
Co by se stalo s míram varablty v jedotlvých městech, pokud by Česká republka vstoupla do měové ue se směým kurzem 26 Kč/EUR?
Míra varablty Pravcov (CZK) Levcov (CZK) Pravcov (EUR) Levcov (EUR) absolutí Výběrový rozptyl 19010 6 1,33310 6 281 065 1 972 Výběrová směrodatá odchylka 13 784 1 154 530 44 Varačí rozpětí 28 000 4 000 1 077 154 relatví Varačí koefcet 0,689 0,058 0,689 0,058 Míra úrově (polohy) Pravcov (CZK) Levcov (CZK) Pravcov (EUR) Levcov (EUR) Průměr 20 000 20 000 769 769 Medá 10 000 20 000 385 769 Modus 9 000 20 000 346 769
Vypočítejte míry varablty (rozptyl, směrodatou odchylku), jestlže jsou údaje z předešlého příkladu zadáy v relatvích četostech a zámy pro celé město (=základí rozptyl). Levcov 1/10 obyvatel má příjem 18 000 Kč 2/10 obyvatel má příjem 19 000 Kč 4/10 obyvatel má příjem 20 000 Kč 2/10 obyvatel má příjem 21 000 Kč zbytek obyvatel má příjem 22 000 Kč
Příjem 22 000 Kč má: 1 2 4 2 1 1 10 10 10 10 10 Průměr z relatvích četostí 1 2 4 2 1 p 18000 19000 20000 21000 22000 20000 10 10 10 10 10 1 k k Rozptyl z relatvích četostí 2 2 2 2 s p p 1 1 2 1 2 2 2 4 2 2 2 1 2 6 18000 19000 20000 21000 22000 20000 1, 210 10 10 10 10 10 2 Směrodatá odchylka s s 1, 210 1095 2 6
Jak se změí průměr, rozptyl a směrodatá odchylka, pokud každou hodotu v souboru zvýším o 10?
Pokud jste ěčemu erozuměl, ebo Vám je ěco ejasé, zastavte se v kozultačích hodách ebo m pošlete e-mal. Rád Vám ejasost vysvětlím. Emal: tomas.karel@gmal.com