Mendelova zemědělsá a lesnicá univerzita Provozně eonomicá faulta Výpočet charateristi ze tříděných údajů Statistia I. protool č. 2 Jan Grmela, 2. roční, Eonomicá informatia Zadání 130810, supina Středa 13:00 14:50 Brno, 21. 3. 2007
1 Zadání úlohy V tabulce je provedeno supinové třídění dealerů jisté počítačové firmy podle počtu usů počítačových sestav, prodaných v posledním čtvrtletí běžného rou. Vypočtěte momentové charateristiy úrovně, variability, šimosti a špičatosti. Použijte ja výpočet ze středů tříd, ta i zavedením pomocné proměnné. Dále odhadněte polohu vartilů a modu. Vypočtěte průměrnou absolutní a relativní odchylu od mediánu. Nareslete graf supinového rozdělení četnosti a vyznačte na něm polohu aritmeticého průměru, mediánu a modu. Na záladě pomocné tabuly sestrojte oncentrační řivu a stanovte polohu mediálu. <50 150) 8 <150 250) 9 <250 350) 7 <350 450) 13 <450 550) 11 <550 650) 75 <650 750) 12 <750 850) 8 2 Postup řešení 2.1 Výpočet významových hodnot 2.1.1 typicá (modální) hodnota modus hodnota s největší četností u dat tříděných supinovým tříděním zjistíme hodnotu modu podle vzorce n m n m 1 =d m h, de 2n m n m 1 n m 1 d m dolní mez modální třídy, n m četnost modální třídy, n m-1 četnost třídy předcházející třídě modální, n m+1 četnost třídy následující po třídě modální, h šířa třídy Modální třídou je třída s největší četností 2.1.2 Kvantily Hodnoty, teré dělí uspořádanou variační řadu v určitém poměru četností. Nejdůležitějšími vantily jsou vartily (dělí uspořádanou řadu hodnot na čtyři stejně početné části): Dolní vartil (25 %) x 0,25 Prostřední vartil (50 %) medián x 0,50 ( ) Horní vartil (75 %) x 0,75 Obecný P vantil vypočítáme dle vzorce x p =d p P p P 1 h de d p dolní mez obsahující příslušný vantil, P 0,25 0,50 0,75, p_{p-1} součtová relativní četnost předcházející třídy, P p -2-
p p relativní četnost třídy obsahující příslušný vantil, h šířa třídy. třída obsahující příslušný vantil je třída, jejíž součtová relativní četnost přeročí hodnotu P daného vantilu odstavce 2.1.1 Absolutní Střed třídy xi číslo hranice tříd četnost ni 1 <50; 150) 100 8 2 <150; 250) 200 9 3 <250; 350) 300 7 4 <350; 450) 400 13 5 <450; 550) 500 11 6 <550; 650) 600 75 7 <650; 750) 700 12 8 <750; 850) 800 8 Suma Tabula 1: Tabula četnosti =500 75 11 100 = 600,39 2 75 11 12 odstavce 2.1.2 Pořadové číslo Vymezení hranice tříd Střed třídy x i Absolutní četnost Relativní četnost p i Součtová relativní četnost pi 1 <50; 150) 100 8 0,055944 0,055944 2 <150; 250) 200 9 0,062937 0,118881 3 <250; 350) 300 7 0,048951 0,167832 4 <350; 450) 400 13 0,090909 0,258741 5 <450; 550) 500 11 0,076923 0,335664 6 <550; 650) 600 75 0,524476 0,860140 7 <650; 750) 700 12 0,083916 0,944056 8 <750; 850) 800 8 0,055944 1,000000 Suma 1,000000 Tabula 2: Tabula četnosti x 0,25 =350 0,25 0,1678 100 = 381,77 0,2587 x 0,50 =550 0,50 0,3357 100 = 581,33 0,5245 x 0,75 =550 0,75 0,3357 100 = 628,99 0,5245 2.2 Graficé určení mediálu a mediánu Lorenzova řiva odhad úhrnu třídy: x i odhad úhrnu hodnot znau za celý soubor: i=1-3- x i
mediál hodnota znau, terá půlí úhrn hodnot znau souboru na dvě stejné části. Bývá větší ja medián. Čím větší je rozdíl mezi mediánem a mediálem, tím větší je oncentrace. Lorenzova řiva vypovídá o rovnoměrnosti resp. nerovnoměrnosti rozdělení úhrnu hodnot znau mezi jednotlivé třídy. Poud by byly všechny hodnoty znau v souboru onstantní, hodnoty součtové relativní četnosti a relativního umulativního úhrnu hodnot znau by se rovnaly a Lorenzova řiva by odpovídala úhlopříčce. Součtová číslo hranice tříd Střed třídy x Absolutní Relativní Úhrn hodnot Relativní relativní i četnost četnost p i x četnost pi [%] i n umulativní i úhrn znau [%] 1 <50; 150) 100 8 0,055944 5,59% 800 1,06% 2 <150; 250) 200 9 0,062937 11,89% 1800 3,46% 3 <250; 350) 300 7 0,048951 16,78% 2100 6,25% 4 <350; 450) 400 13 0,090909 25,87% 5200 13,16% 5 <450; 550) 500 11 0,076923 33,57% 5500 20,48% 6 <550; 650) 600 75 0,524476 86,01% 45000 80,32% 7 <650; 750) 700 12 0,083916 94,41% 8400 91,49% 8 <750; 850) 800 8 0,055944 100,00% 6400 100,00% Suma 1,000000 75200 Tabula 3: Pomocná tabula pro sestrojení Lorenzovy řivy Graf viz příloha Koncentrační řiva prodaných počítačových sestav. 2.3 Výpočet momentových charateristi úrovně a variability charateristiy úrovně: aritmeticý průměr. charateristiy variability: rozptyl s x 2 průměrná čtvercová odchyla od aritmeticého průměru, směrodatná odchyla s x, variační oeficient v x - směrodatná odchyla v relativním vyjádření. Variabilita způsob uspořádání hodnot uvnitř souboru vzhledem něteré střední hodnotě. 2.3.1 Výpočet ze středů tříd u velého rozsahu souboru (v našem případě) použijeme pro výpočet aritmeticého průměru vzorec pro výpočet váženého aritmeticého průměru = 1 n i =1 x i. vážený výpočet rozptylu: s 2 x = 1 N i 2 = 1 i =1 =1 x i 2 2. 2 výpočet směrodatné odchyly: s x = s x výpočet variačního oeficientu: v x = s x [1] [2] pro výpočet aritmeticého průměru využijeme hodnot z Tabuly č. 3 = 75200 pro výpočet rozptylu použijeme údaje z následující tabuly: = 525,87-4-
s 2 x = 43900000 525,87 2 = 30453,75 výpočet směrodatné odchyly: s x = 30453,75 =174,51 výpočet variačního oeficientu v x = 174,51 = 0,3319 525,87 2.3.2 Výpočet metodou transformace středu tříd (znaů) Zavedeme si pomocnou proměnnou z i, pro níž platí: a h Pa číslo hranice tříd Střed třídy x Absolutní i četnost x i2 1 <50; 150) 100 8 80000 2 <150; 250) 200 9 360000 3 <250; 350) 300 7 630000 4 <350; 450) 400 13 2080000 5 <450; 550) 500 11 2750000 6 <550; 650) 600 75 27000000 7 <650; 750) 700 12 5880000 8 <750; 850) 800 8 5120000 Suma 43900000 Tabula 4: Pomocná tabula pro výpočet rozptylu střed třídy s největší četností šířa třídy. z i = x i a h [3], de vážený aritmeticý průměr pomocné proměnné spočítáme: z= 1 z. n=1 aritmeticý průměr je: = z h a. rozptyl pomocné proměnné: s z 2 = 1 n i =1 x i 2 z 2. rozptyl: s x 2 =s z 2 h 2. směrodatnou odchylu a variační oeficient vypočteme ze vztahů [1] a [2]. Zjistíme hodnoty z i dosazením do vztahu [3]. Střed třídy s největší četností je dle Tabuly č. 1 a=600, šířa třídy h=100. -5-
číslo hranice tříd Střed třídy x Absolutní i četnost z i z i z i2 1 <50; 150) 100 8-5 -40 200 2 <150; 250) 200 9-4 -36 144 3 <250; 350) 300 7-3 -21 63 4 <350; 450) 400 13-2 -26 52 5 <450; 550) 500 11-1 -11 11 6 <550; 650) 600 75 0 0 0 7 <650; 750) 700 12 1 12 12 8 <750; 850) 800 8 2 16 32 Suma -106 514 Tabula 5: Pomocná tabula pro výpočet charateristi metodou transformace vážený aritmeticý průměr pomocné proměnné je z= 106 = 0,7413 aritmeticý průměr: = 0,7413 100 600 = 525,87 rozptyl pomocné proměnné: s z 2 = 514 0,7413 2 = 3,0449 rozptyl: s 2 x =3,0449 100 2 = 30448,7990 směrodatná odchyla s x = 30448,7990 = 174,4959 variační oeficient v x = 174,4959 = 0,3318 525,87 2.4 Výpočet průměrné absolutní a relativní odchyly od mediánu průměrná absolutní odchyla od mediánu d aritmeticý průměr absolutních hodnot odchyle hodnot znau od mediánu ve vážené formě: d = 1 x. i =1 průměrnou relativní odchylu od mediánu d ' zísáme vydělením průměrné absolutní odchyly od mediánu aritmeticým průměrem: d d ' =. Pro výpočet průměrné absolutní odchyly od mediánu využijeme výsledů z následující tabuly: číslo hranice tříd Střed třídy x Absolutní i četnost x i x 0,50 1 <50; 150) 100 8 3850,640 2 <150; 250) 200 9 3431,970 3 <250; 350) 300 7 1969,310 4 <350; 450) 400 13 2357,290 5 <450; 550) 500 11 894,630 6 <550; 650) 600 75 1400,250 7 <650; 750) 700 12 1424,040 8 <750; 850) 800 8 1749,360 Suma 17077,490 Tabula 6: Pomocná tabula pro výpočet průměrné absolutní odchyly od mediánu d = 17077,490 = 119,423. -6-
Průměrná relativní odchyla od mediánu: d ' = 119,423 525,87 = 0,2271 2.5 Výpočet momentových charateristi šimosti a špičatosti Momentový oeficient šimosti 3 třetí normovaný moment: 3 = 1 u 3, de i=1 = x i s x Pro doonale souměrná data nabývá momentový oeficient šimosti hodnoty nula. Kladná hodnota signalizuje levostranou (ladnou) asymetrii, zatímco jeho záporná hodnota svědčí o pravostranné (záporné) asymetrii. Momentový oeficient špičatosti 4 čtvrtý normovaný moment zmenšený o tři: 4 = 1 u 4 3, de = x i i=1 s x Je-li hodnota momentového oeficientu špičatosti rovna nula, hovoříme o normální špičatosti, je-li menší než nula, jde o podnormální špičatost, v opačném případě o nadnormální špičatost. Pro výpočet obou oeficientů využijeme tuto tabulu: číslo hranice tříd Střed třídy x Absolutní i četnost 3 3 4 4 1 <50; 150) 100 8-2,4406-14,5370-116,2962 35,4787 283,8293 2 <150; 250) 200 9-1,8675-6,5129-58,6165 12,1629 109,4660 3 <250; 350) 300 7-1,2944-2,1688-15,1816 2,8073 19,6513 4 <350; 450) 400 13-0,7213-0,3753-4,8793 0,2707 3,5196 5 <450; 550) 500 11-0,1483-0,0033-0,0358 0,0005 0,0053 6 <550; 650) 600 75 0,4248 0,0767 5,7503 0,0326 2,4428 7 <650; 750) 700 12 0,9979 0,9937 11,9247 0,9916 11,8997 8 <750; 850) 800 8 1,5710 3,8772 31,0173 6,0910 48,7276 Suma -146,32 479,54 Tabula 7: Tabula pro výpočet šimosti a špičatosti Šimost: 3 = 146,32 = 1,0232 Výslede uazuje, že se jedná o pravostrannou asymetrii. Špičatost: 4 = 479,54 3 =0,3544 Výslede uazuje, že se jedná o nadnormální špičatost. 2.6 Graficé znázornění průměru modu a mediánu Viz příloha: Histogram četnosti prodaných počítačových sestav -7-
3 Souhrn jednotlivých výsledů 600,39s x 0,25 381,77s x 0,50 581,33s x 0,75 628,99s 525,87s mediál cca 597 s 2 s x 30453,75 s s x 174,51s v x 0,3319 33,19 3 1,0232 4 0,3544 119,423s d ' d 0,2271 22,71 4 Přílohy 100,00% 90,00% 80,00% Koncentrační řiva prodaných počítačových sestav 850 750 650 Realtiv ní umulativ ní četnost 70,00% 60,00% 50,00% 40,00% 30,00% 20,00% 10,00% 0,00% 0,00% 10,00% 20,00% 30,00% 40,00% 50,00% 60,00% 70,00% 80,00% 90,00% 100,00% Relativ ní umulativ ní úhrn <- mediál <- medián 550 450 350 250 150-8-
80 Histogram četnosti prodaných počítačových sestav 70 60 Počet dealerů 50 40 30 20 modus 10 0 průměr <50; 150) <150; 250) <250; 350) <350; 450) <450; 550) <550; 650) <650; 750) <750; 850) Počet prodaných usů medián -9-