Statitické metody ve veřejé právě ŘEŠENÉ PŘÍKLADY Ig. Václav Friedrich, Ph.D. 2013 1
Kapitola 2 Popi tatitických dat 2.1 Tabulka obahuje rozděleí pracovíků podle platových tříd: TARIF PLAT POČET TARIF PLAT POČET třída 6 16 400 213 třída 10 20 000 87 třída 7 17 200 354 třída 11 21 300 25 třída 8 18 000 289 třída 12 22 600 4 třída 9 19 000 153 a) Určete, jakého typu jou tatitické zaky platová třída a tarifi plat. b) Doplňte tabulku o relativí a kumulativí četoti. c) Určete mediá a modu zaku platová třída. d) Určete tředí hodotu a měrodatou odchylku zaku tarifí plat. ad a) platová třída ordiálí tatitický zak tarifí plat metrický tatitický zak ad b) tabulka četotí: TARIF PLAT ČETNOSTI KUM. ČETNOSTI ab. rel. ab. rel. třída 6 16 400 213 18,9% 213 18,9% třída 7 17 200 354 31,5% 567 50,4% třída 8 18 000 289 25,7% 856 76,1% třída 9 19 000 153 13,6% 1009 89,7% třída 10 20 000 87 7,7% 1096 97,4% třída 11 21 300 25 2,2% 1121 99,6% třída 12 22 600 4 0,4% 1125 100,0% CELKEM 1125 100,0% x x ad c) mediá prví hodota, jejíž relativí kumulativí četot je vyšší ež 50% mediá je platová třída 7 (F 7 = 50,4 %) modu hodota ejvyšší četotí (abolutí ebo relativí) modu je platová třída 7 (p 7 = 31,5 %) 2
ad d) tředí hodota zaku tarifí plat vážeý aritmetický průměr umu x k i 1 i i k i 1 xi 20053900 1125 i 17826 Kč x v Excelu počítáme pomocí fukce SOUČIN.SKALÁRNÍ SOUČIN.SKALÁRNÍ(PLAT; ČETNOSTI ab.) k výpočtu měrodaté odchylky ejprve zjitíme (výběrový) rozptyl umu k 2 2 i xi x 11 2 2 i 1 3,5907 10 1125 17826 1595547591 1419526 1 1124 1124 k i 1 i x pomocí Excelu opět počítáme fukcí SOUČIN.SKALÁRNÍ 2 i SOUČIN.SKALÁRNÍ(PLAT; PLAT; ČETNOSTI ab.) měrodatou odchylku určíme jako odmociu z rozptylu 2 = = 1419526 = 1191 Kč 2.2 Tabulka obahuje přehled o pravidelém měíčím pořeí klietů veické kampeličky: MĚSÍČNÍ SPOŘENÍ POČET 0 až 200 5 200 až 400 9 400 až 600 12 600 až 800 11 800 až 1000 6 více ež 1000 2 a) Vypočtěte aritmetický průměr a mediá zaku měíčí pořeí. b) Vypočtěte rozptyl a měrodatou odchylku. ad a) k výpočtu charakteritik v itervalovém rozděleí určíme tředy itervalů tabulku doplíme o relativí a kumulativí četoti a přidáme loupcové oučty třed poledího (polootevřeého) itervalu je třeba odhadout - ěkdy e bere ve vzdáleoti šířky předchozích itervalů od dolí meze - jidy jako 1,5 áobek dolí meze 3
MĚSÍČNÍ SPOŘENÍ x i i p i m i F i 0 až 200 100 5 11,1% 5 11,1% 200 až 400 300 9 20,0% 14 31,1% 400 až 600 500 12 26,7% 26 57,8% 600 až 800 700 11 24,4% 37 82,2% 800 až 1000 900 6 13,3% 43 95,6% více ež 1000 1200 2 4,4% 45 100,0% CELKEM 45 100,0 % x x průměr zaku měíčí pořeí vážeý průměr tředích hodot itervalů k i xi i 1 24700 x 549 Kč 45 charakteritiky v itervalovém rozděleí četotí jou pouze odhady pokud bychom brali třed poledího itervalu ve výši 1,5 áobku dolí meze (tj. 1500 Kč), dotali bychom jiý odhad k i xi i 1 25300 x 562 Kč 45 mediá prví hodota, jejíž relativí kumulativí četot je vyšší ež 50% mediá je iterval 400 600 Kč (třed itervalu 500 Kč) mediá je robutí charakteritika eí citlivá a změy v poledím itervalu ad b) výběrový rozptyl zaku měíčí pořeí jako vážeý rozptyl tředů itervalů k 2 2 i xi x 2 i 1 16990000 2 45 549 3432444 1 44 44 měrodatá odchylka - odmocia z rozptylu 2 = = 78010 = 279 Kč 78010 odhady variability u itervalového rozděleí podhodocují kutečou variabilitu 4
Kapitola 3 Měřeí záviloti tatitických zaků 3.1 U patácti vybraých domácotí byla zjištěa obytá plocha a ájemé: čílo plocha (m 2 ) ájemé (Kč) čílo plocha (m 2 ) ájemé (Kč) 1 82,6 970 9 66,1 1600 2 57,3 795 10 93,0 830 3 70,4 1400 11 52,6 225 4 65,0 200 12 70,0 1325 5 48,4 390 13 84,2 1900 6 103,8 2320 14 55,0 615 7 73,6 1010 15 81,3 560 8 43,5 280 a) Vypočítejte charakteritiky obou zaků a pomocí korelačího koeficietu určete, zda je mezi oběma proměými závilot. b) Vyjádřete tuto závilot pomocí lieárí regreí fukce a dále zkute odhadout výši ájmu v bytě rozlohou 90 m 2. ad a) charakteritiky počítáme pomocí tatitických fukcí v Excelu obytá plocha - tředí hodota x = 69,8 m 2 (PRŮMĚR) rozptyl 2 x = 290,7 (VAR.S) měrodatá odchylka x = 17,1 m 2 (SMODCH.VÝBĚR.S) ájemé - tředí hodota y = 961 Kč rozptyl 2 y = 407177 měrodatá odchylka y = 638 Kč k porováí variabilit růzorodých metrických zaků e používá variačí koeficiet: VK 100 % x v ašem případě: obytá plocha - VK x = 24 % ájemé - VK y = 66 % ájemé vykazuje vyšší variabilitu (vzájemé rozdíly) ež rozměry bytu družeé charakteritiky obou zaků kovariace a korelačí koeficiet kovariace xy = 7427,7 (COVARIANCE.S) korelace r xy = 0,68 (CORREL) mezi plochou bytu a ájemým je tředí pozitiví závilot (viz tabulka, obr. 3.6) 5
ad b) koeficiety regreí fukce počítáme pomocí fukcí v Excelu regreí koeficiet (klo) - b 1 = 25,5 (SLOPE) kotata, průečík oou y b 0 = -822 (INTERCEPT) lieárí regreí fukce: y = 25,5 x 822 odhad ájmu v bytě rozlohou 90 m 2 doadíme x = 90 do regreí rovice y(90) = 25,5. 90 822 = 1478 Kč 3.2 V průzkumu ázorových potojů tudetů byly zjišťováy odpovědi a otázku Jte pro zavedeí školého a vyokých školách? (zak X) možými odpověďmi: ao evím e. Součaě byla zjišťováa politická orietace tudetů (zak Y) možými variatami levice třed pravice. Do průzkumu bylo zařazeo 280 tudetů, výledky zobrazuje tabulka: X \ Y LEVICE STŘED PRAVICE ANO 11 20 28 NEVÍM 32 53 22 NE 43 52 19 a) Doplňte tabulku o margiálí četoti zaků X a Y. Z tabulky odečtěte, kolik tudetů odpovědělo evím. b) Změřte ílu záviloti potoje tudetů k zavedeí školého a vyokých školách a jejich politické orietaci pomocí Cramerova kotigečího koeficietu. ad a) tabulka doplěými margiálími četotmi X \ Y LEVICE STŘED PRAVICE CELKEM ANO 11 20 28 59 NEVÍM 32 53 22 107 NE 43 52 19 114 CELKEM 86 125 69 280 evím odpovědělo 107 tudetů, což je 107 / 280 = 38 % ad b) vytvoříme tabulku očekávaých četotí e ij 1 1 apř. e11 59 86 18,1 280 očekávaé četoti mohou být deetiá číla 6
E IJ LEVICE STŘED PRAVICE CELKEM ANO 18,1 26,3 14,5 59 NEVÍM 32,9 47,8 26,4 107 NE 35,0 50,9 28,1 114 CELKEM 86 125 69 280 řádkové a loupcové oučty muí být tejé jako u původí tabulky yí počítáme tabulku idividuálích χ 2 - měr aociace G ij apř. G G IJ 11 11 11 e 11 e 2 2 11 18,1 18,1 2,8 LEVICE STŘED PRAVICE CELKEM ANO 2,8 1,5 12,5 16,8 NEVÍM 0,0 0,6 0,7 1,3 NE 1,8 0,0 2,9 4,8 CELKEM 4,6 2,1 16,1 22,9 tabulka obahuje jedu hodotu vyšší ež 5 kombiace ANO x PRAVICE doahuje výrazě vyššího počtu repodetů (28) oproti očekávaé hodotě (14,5) celkovou χ 2 - míru aociace ajdeme v pravém dolím rohu tabulky r G G i 1 j 1 ij 22,9 k poouzeí míry záviloti počítáme Cramerův kotigečí koeficiet G 22,9 V 0,202 h 280 2 mezi politickou orietací tudetů a jejich ázorem a zavedeí školého je labá závilot (viz tabulka, obr. 3.6) 7
Kapitola 4 Náhodý výběr a ormálí rozděleí 4.1 Ve fiále televizí outěže je v oudí 10 míčků, z toho 3 červeé. Při loováí i outěžící áhodě vytáhe z oudí 2 míčky. Pokud jou oba červeé, vyhrál hlaví ceu. V loňkém roce v 52 loováích vyhrálo hlaví ceu pouze 5 outěžících. a) Určete teoretickou pravděpodobot, že outěžící ve fiále vyhraje hlaví ceu. b) Určete tatitickou pravděpodobot, že outěžící ve fiále vyhraje hlaví ceu. c) Porovejte oba výledky. ad a) počet přízivých výledků (m) a počet všech možých výledků () můžeme vyjádřit pomocí kombiačích číel 3 m 2 3 PA ( ) 0,067 10 45 2 6,7 % kombiačí čílo v Excelu fukce KOMBINACE ad b) tatitická pravděpodobot m 5 PA ( ) 0,096 52 9,6 % 4.2 Dikrétí áhodá veličia X abývá celočíelých hodot 0 až 4 těmito pravděpodobotmi: X 0 1 2 3 4 p(x) 0,11 0,25 0,28 0,22 a) Doplňte tabulku pravděpodobotí fukce o chybějící čílo. b) Určete pravděpodoboti P(2 < X 4) a P(2 X < 4). c) Spočítejte tředí hodotu a měrodatou odchylku áhodé veličiy X. ad a) doplíme tabulku pravděpodobotí fukce, aby px ( ) 1 X 0 1 2 3 4 p(x) 0,11 0,25 0,28 0,22 0,14 ad b) pravděpodoboti zíkáme přímo z tabulky 8 i i
P(2 < X 4) = P(3) + P(4) = 0,22 + 0,14 = 0,36 = 36 % P(2 X < 4) = P(2) + P(3) = 0,28 + 0,22 = 0,50 = 50 % 4.3 Tety ových baterií SCALA ukazují, že průměrá životot baterie je 230 hodi e měrodatou odchylkou 20 hodi. Předpokládejme, že životot baterie má přibližě ormálí rozděleí pravděpodoboti. a) Jaká je pravděpodobot, že áhodě vybraá baterie vydrží déle ež 250 hodi? b) Jakou životot má výrobce uvét do pecifikace, aby této hodotě vyhovovalo miimálě 95% všech vyrobeých baterií? ad a) vyjdeme ze vztahu: P( X 250) 1 P( X 250) 1 F (250) hodotu ditribučí fukce zíkáme pomocí excelovké fukce NORM.DIST NORM.DIST(250; 230; 20; 1) = 0,841 hledaá pravděpodobot: PX ( 250) 1 0,841 0,159 15,9% ad b) hledáme hodotu x, pro kterou platí: eboli: P( X x ) 0,95 P( X x ) 0,05 jiými lovy, hledáme 5% kvatil ormálího rozděleí x 0,05 hodotu kvatilu v Excelu zíkáme pomocí fukce NORM.INV NORM.INV(0,05; 230; 20) = 197 hodi 9
Kapitola 5 Metody matematické tatitiky 5.1 Prodeja chce zjitit průměrý počet zákazíků v pátečí odpoledí měě. Po dobu 2 měíců tedy leduje počet zákazíků, kteří prošli pokladami prodejy, tímto výledkem: 527 418 495 554 392 548 449 511 Určete 95% itervalový odhad pro průměrý počet zákazíků obloužeých v jedé měě. ejprve počítáme charakteritiky výběrového ouboru rozah = 8 fukce POČET tředí hodota x = 486,8 fukce PRŮMĚR měr. odchylka = 60,6 fukce SMODCH.VÝBĚR.S k výpočtu 95% itervalu polehlivoti použijeme vzorec x t1 / 2( 1) x t1 / 2( 1) hodotu 97,5% kvatilu Studetova rozděleí t 0,975 (7) zíkáme v Excelu pomocí fukce T.INV(0,975; 7) = 2,365 doazeím do vzorce zíkáme: 60,6 60,6 486,8 2,365 486,8 2,365 8 8 436 537 druhá variata využitím excelovké fukce CONFIDENCE.T prví parametr fukce: α = 1 p = 1 0,95 = 0,05 CONFIDENCE.T(0,05; 60,6; 8) = 50,6 hodota fukce uvádí vzdáleot mezí itervalu od jeho tředu dolí mez: 486,8 50,6 = 436 horí mez: 486,8 + 50,6 = 537 5.2 Při průzkumu průměrého příjmu a 1 člea domácoti chceme docílit maximálí chyby odhadu 100 Kč při 95% polehlivoti. Jak velký výběrový oubor je třeba zvolit, pokud víte, že měrodatá odchylka příjmových údajů v aší republice čií 750 Kč? velikot výběru počítáme podle vzorce: kde z 1 /2 = z 0,975 = 1,96 2 2 z1 /2 1,96 750 100 10 216 domácotí
5.3 Om vzorků erotu bylo tetováo a obah aktiví látky. Naměřeé hodoty v promile udává áledující tabulka: 18,6 27,6 27,5 25,0 24,5 26,8 29,7 26,5 Lze a základě těchto měřeí tvrdit, že ve zkoumaém erotu je více ež 25 promile aktiví látky? Tetujte a hladiě α = 5%. provedeme jedotraý jedovýběrový parametrický tet tředí hodoty hypotézami H 0 : μ = 25 H 1 : μ > 25 počítáme výběrové charakteritiky vzorku rozah = 8 fukce POČET tředí hodota x = 25,8 fukce PRŮMĚR měr. odchylka = 3,32 fukce SMODCH.VÝBĚR.S výběrový průměr x > 25 je v ouladu alterativí hypotézou určíme hodotu tetové tatitiky pro t- tet x 0 25,8 25 T 8 0,66 3,32 yí počítáme igifikaci (p hodotu) tetu Sig T 1 F( T ) 1 F (0,66) 1 0,735 0, 265 hodotu ditribučí fukce F(x) Studetova rozděleí jme určili pomocí excelovké fukce T.DIST(0,66; 7; 1) = 0,735 eboť platí Sig T > α, ezamítáme ulovou hypotézu H 0 závěr tetu: Nelze tvrdit, že ve zkoumaém vzorku je více ež 25 aktiví látky. 11
Kapitola 6 Idexy a čaové řady 6.1 V ledu 2011 tála kiha 850 Kč. V tomto měíci e jí prodalo 40 k. V měíci dubu 2011 došlo ke ížeí cey a 600 Kč. V témže měíci e prodalo 55 k této kihy. Porovejte vývoj prodeje kihy mezi oběma měíci pomocí extezitích, itezitích a ouhrých extezitích ukazatelů. vývoj extezitího ukazatele q počet prodaých kuů q 0 = 40 q 1 = 55 Iq = 55 / 40 = 1,375 +37,5 % vývoj itezitího ukazatele p jedotková cea p 0 = 850 p 1 = 600 Ip = 600 / 850 = 0,706-29,4 % vývoj ouhrého extezitího ukazatele tržby IQ = Ip. Iq = 0,706. 1,375 = 0,971-3,9 % 6.2 Tabulka uvádí vývoj cey a prodaého možtví mléka (jedotka = 1 litr) ve třech prodejách A, B a C za dva měíce březe a dube 2012. MÍSTO CENA PRODANÉ MNOŽSTVÍ PRODEJE březe 12 dube 12 březe 12 dube 12 p 0 p 1 q 0 q 1 A 10 12 100 80 B 15 15 100 120 C 13 15 120 100 a) Určete pomocí idexů vývoj celkového prodaého možtví, vývoj průměré cey a vývoj celkové tržby. b) Zjitěte, jaký vliv měl a změu průměré cey mléka vývoj jedotkových ce a jaký změa truktury prodeje. c) Zjitěte, jaký vliv měl a změu celkové tržby za prodej mléka vývoj jedotkových ce a jaký změa objemu prodeje. ad a) doplíme tabulku o tržby, včetě fiktivích, a dále oučty a průměry p 0 p 1 q 0 q 1 p 0 q 0 p 1 q 1 p 0 q 1 p 1 q 0 A 10 12 100 80 1000 960 800 1200 B 15 15 100 120 1500 1800 1800 1500 C 13 15 120 100 1560 1500 1300 1800 SOUČET x x 320 300 4060 4260 3900 4500 PRŮMĚR x x x x 12,69 14,20 13,00 14,06 12
potupý rozklad vývoje průměré cey zobrazíme pomocí magického koočtverce ložeý idex průměré cey Ip = 14,20 / 12,69 = 1,12 +12 % průměrá cea vzrotla o 12 % I SS idex tálého ložeí vyjadřuje vliv vývoje jedotkových ce cca +10% I STR idex truktury vyjadřuje vliv změy truktury prodeje cca +2 % ad b) potupý rozklad vývoje ouhré tržby zobrazíme pomocí magického koočtverce ze oučtů tržeb hodotový idex I H = 4260 / 4060 = 1,05 +5 % ouhrá tržba vzrotla o 5 % I p ceový idex vyjadřuje vliv změy ce a tržbu cca +10 % I q objemový idex vyjadřuje vliv změ objemu prodeje a tržbu cca -5 % 6.3 Tabulka 5.3 ukazuje tav koruových vkladů domácotí v Čeké republice v mld. Kč. rok 1990 1991 1992 1993 1994 1995 1996 idex 184,0 220,7 260,2 316,1 376,2 454,7 527,3 Převeďte hodoty v této tabulce a idexy: a) bazické e základím rokem 1990; b) bazické e základím rokem 1995; c) řetězové. 13
ad a) bazické idexy zíkáme děleím všech hodot v tabulce hodotou z roku 1990 apř. I 91 (90) = 220,7 / 184,0 = 1,20 rok 1990 1991 1992 1993 1994 1995 1996 idex 1,00 1,20 1,41 1,72 2,04 2,47 2,87 ad b) bazické idexy zíkáme děleím všech hodot v tabulce hodotou z roku 1995 apř. I 91 (95) = 220,7 / 454,7 = 0,49 rok 1990 1991 1992 1993 1994 1995 1996 idex 0,40 0,49 0,57 0,70 0,83 1,00 1,16 ad c) řetězové idexy zíkáme děleím hodot v tabulce hodotou z předcházejícího roku apř. I () () 91 = 220,7 / 184,0 = 1,20 I 90 elze určit rok 1990 1991 1992 1993 1994 1995 1996 idex x 1,20 1,18 1,21 1,19 1,21 1,16 14