Mendelova zemědělská a lesnická univerzita Provozně ekonomická fakulta. Výpočet charakteristik ze tříděných údajů Statistika I. protokol č.



Podobné dokumenty
Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

PRAVDĚPODOBNOST A STATISTIKA

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

VŠB-TU OSTRAVA, FAKULTA ELEKTROTECHNIKY A INFORMATIKY, KATEDRA APLIKOVANÉ MATEMATIKY. Statistika. Vzorce a tabulky

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

Zápočtová práce STATISTIKA I

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA. Charakteristiky variability. Mgr. Jakub Němec. VY_32_INOVACE_M4r0120

Matematická statistika

KGG/STG Statistika pro geografy

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Závislost indexů C p,c pk na způsobu výpočtu směrodatné odchylky

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Popisná statistika kvantitativní veličiny

Číselné charakteristiky

STATISTICKÉ CHARAKTERISTIKY

Písemná práce k modulu Statistika

Mendelova zemědělská a lesnická univerzita v Brně Institut celoživotního vzdělávání Fakulta regionálního rozvoje a mezinárodních studií

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Statistika pro geografy

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Analýza dat na PC I.

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Příloha č. 1 Část II. Ekonomika systému IDS JMK

Měření na trojfázovém transformátoru naprázdno a nakrátko.

Základy teorie pravděpodobnosti

Popisná statistika. Komentované řešení pomocí MS Excel

Pravděpodobnost a statistika

Funkce hustoty pravděpodobnosti této veličiny je. Pro obecný počet stupňů volnosti je náhodná veličina

6. Měření Youngova modulu pružnosti v tahu a ve smyku

Alternativní rozdělení. Alternativní rozdělení. Binomické rozdělení. Binomické rozdělení

χ 2 testy. Test nekorelovanosti.

Pravděpodobnost a matematická statistika

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Číselné charakteristiky a jejich výpočet

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Absorpční vlastnosti plazmatu směsí SF 6 a PTFE

UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE

Možnosti stanovení příčné tuhosti flexi-coil pružin

Třídění statistických dat

NEPARAMETRICKÉ TESTY

Lineární regrese. Komentované řešení pomocí MS Excel

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Server Internetu prostøednictvím slu eb (web, , pøenos souborù) poskytuje data. Na na í pracovní stanici Internet

Server Internetu prostøednictvím slu eb (web, , pøenos souborù) poskytuje data. Na na í pracovní stanici Internet

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Statistika. Program R. popisná (deskriptivní) statistika popis konkrétních dat. induktivní (konfirmatorní) statistika. popisná statistika

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

6. T e s t o v á n í h y p o t é z

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Základy popisné statistiky

VYSOK A ˇ SKOLA POLYTECHNICK A JIHLAVA Katedra matematiky Statistick a anal yza a ˇ casov e ˇ rady v pˇ r ıkladech Stanislava Dvoˇ r akov a 2015

Náhodná veličina a rozdělení pravděpodobnosti

Algebraické výrazy - řešené úlohy

( ) ( ) Vzorce pro dvojnásobný úhel. π z hodnot goniometrických funkcí. Předpoklady: Začneme příkladem.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

6 5 = 0, = 0, = 0, = 0, 0032

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Tomáš Karel LS 2012/2013

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

Regresní a korelační analýza

Praktická statistika. Petr Ponížil Eva Kutálková

6 Mezní stavy únosnosti

8 Střední hodnota a rozptyl

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Popisná statistika. Statistika pro sociology

Protokol č. 1. Tloušťková struktura. Zadání:

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

Charakteristiky kategoriálních veličin. Absolutní četnosti (FREQUENCY)

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

1. ročník, 2011/ 2012 Medzinárodný korešpondenčný seminár iks

Semestrální práce Průzkum zpoždění autobusové linky 143 v zastávce stadion Strahov. Statistika

Základní statistické charakteristiky

VI. Derivace složené funkce.

7.3.9 Směrnicový tvar rovnice přímky

( x) ( ) ( ) { } Vzorce pro dvojnásobný úhel II. Předpoklady: Urči definiční obor výrazů a zjednoduš je. 2. x x x

Metodologie pro ISK II

4ST201 STATISTIKA CVIČENÍ Č. 7

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Mnohorozměrná statistická data

Mnohorozměrná statistická data

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Národníinformačnístředisko pro podporu jakosti

cv3.tex. Vzorec pro úplnou pravděpodobnost

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Transkript:

Mendelova zemědělsá a lesnicá univerzita Provozně eonomicá faulta Výpočet charateristi ze tříděných údajů Statistia I. protool č. 2 Jan Grmela, 2. roční, Eonomicá informatia Zadání 130810, supina Středa 13:00 14:50 Brno, 21. 3. 2007

1 Zadání úlohy V tabulce je provedeno supinové třídění dealerů jisté počítačové firmy podle počtu usů počítačových sestav, prodaných v posledním čtvrtletí běžného rou. Vypočtěte momentové charateristiy úrovně, variability, šimosti a špičatosti. Použijte ja výpočet ze středů tříd, ta i zavedením pomocné proměnné. Dále odhadněte polohu vartilů a modu. Vypočtěte průměrnou absolutní a relativní odchylu od mediánu. Nareslete graf supinového rozdělení četnosti a vyznačte na něm polohu aritmeticého průměru, mediánu a modu. Na záladě pomocné tabuly sestrojte oncentrační řivu a stanovte polohu mediálu. <50 150) 8 <150 250) 9 <250 350) 7 <350 450) 13 <450 550) 11 <550 650) 75 <650 750) 12 <750 850) 8 2 Postup řešení 2.1 Výpočet významových hodnot 2.1.1 typicá (modální) hodnota modus hodnota s největší četností u dat tříděných supinovým tříděním zjistíme hodnotu modu podle vzorce n m n m 1 =d m h, de 2n m n m 1 n m 1 d m dolní mez modální třídy, n m četnost modální třídy, n m-1 četnost třídy předcházející třídě modální, n m+1 četnost třídy následující po třídě modální, h šířa třídy Modální třídou je třída s největší četností 2.1.2 Kvantily Hodnoty, teré dělí uspořádanou variační řadu v určitém poměru četností. Nejdůležitějšími vantily jsou vartily (dělí uspořádanou řadu hodnot na čtyři stejně početné části): Dolní vartil (25 %) x 0,25 Prostřední vartil (50 %) medián x 0,50 ( ) Horní vartil (75 %) x 0,75 Obecný P vantil vypočítáme dle vzorce x p =d p P p P 1 h de d p dolní mez obsahující příslušný vantil, P 0,25 0,50 0,75, p_{p-1} součtová relativní četnost předcházející třídy, P p -2-

p p relativní četnost třídy obsahující příslušný vantil, h šířa třídy. třída obsahující příslušný vantil je třída, jejíž součtová relativní četnost přeročí hodnotu P daného vantilu odstavce 2.1.1 Absolutní Střed třídy xi číslo hranice tříd četnost ni 1 <50; 150) 100 8 2 <150; 250) 200 9 3 <250; 350) 300 7 4 <350; 450) 400 13 5 <450; 550) 500 11 6 <550; 650) 600 75 7 <650; 750) 700 12 8 <750; 850) 800 8 Suma Tabula 1: Tabula četnosti =500 75 11 100 = 600,39 2 75 11 12 odstavce 2.1.2 Pořadové číslo Vymezení hranice tříd Střed třídy x i Absolutní četnost Relativní četnost p i Součtová relativní četnost pi 1 <50; 150) 100 8 0,055944 0,055944 2 <150; 250) 200 9 0,062937 0,118881 3 <250; 350) 300 7 0,048951 0,167832 4 <350; 450) 400 13 0,090909 0,258741 5 <450; 550) 500 11 0,076923 0,335664 6 <550; 650) 600 75 0,524476 0,860140 7 <650; 750) 700 12 0,083916 0,944056 8 <750; 850) 800 8 0,055944 1,000000 Suma 1,000000 Tabula 2: Tabula četnosti x 0,25 =350 0,25 0,1678 100 = 381,77 0,2587 x 0,50 =550 0,50 0,3357 100 = 581,33 0,5245 x 0,75 =550 0,75 0,3357 100 = 628,99 0,5245 2.2 Graficé určení mediálu a mediánu Lorenzova řiva odhad úhrnu třídy: x i odhad úhrnu hodnot znau za celý soubor: i=1-3- x i

mediál hodnota znau, terá půlí úhrn hodnot znau souboru na dvě stejné části. Bývá větší ja medián. Čím větší je rozdíl mezi mediánem a mediálem, tím větší je oncentrace. Lorenzova řiva vypovídá o rovnoměrnosti resp. nerovnoměrnosti rozdělení úhrnu hodnot znau mezi jednotlivé třídy. Poud by byly všechny hodnoty znau v souboru onstantní, hodnoty součtové relativní četnosti a relativního umulativního úhrnu hodnot znau by se rovnaly a Lorenzova řiva by odpovídala úhlopříčce. Součtová číslo hranice tříd Střed třídy x Absolutní Relativní Úhrn hodnot Relativní relativní i četnost četnost p i x četnost pi [%] i n umulativní i úhrn znau [%] 1 <50; 150) 100 8 0,055944 5,59% 800 1,06% 2 <150; 250) 200 9 0,062937 11,89% 1800 3,46% 3 <250; 350) 300 7 0,048951 16,78% 2100 6,25% 4 <350; 450) 400 13 0,090909 25,87% 5200 13,16% 5 <450; 550) 500 11 0,076923 33,57% 5500 20,48% 6 <550; 650) 600 75 0,524476 86,01% 45000 80,32% 7 <650; 750) 700 12 0,083916 94,41% 8400 91,49% 8 <750; 850) 800 8 0,055944 100,00% 6400 100,00% Suma 1,000000 75200 Tabula 3: Pomocná tabula pro sestrojení Lorenzovy řivy Graf viz příloha Koncentrační řiva prodaných počítačových sestav. 2.3 Výpočet momentových charateristi úrovně a variability charateristiy úrovně: aritmeticý průměr. charateristiy variability: rozptyl s x 2 průměrná čtvercová odchyla od aritmeticého průměru, směrodatná odchyla s x, variační oeficient v x - směrodatná odchyla v relativním vyjádření. Variabilita způsob uspořádání hodnot uvnitř souboru vzhledem něteré střední hodnotě. 2.3.1 Výpočet ze středů tříd u velého rozsahu souboru (v našem případě) použijeme pro výpočet aritmeticého průměru vzorec pro výpočet váženého aritmeticého průměru = 1 n i =1 x i. vážený výpočet rozptylu: s 2 x = 1 N i 2 = 1 i =1 =1 x i 2 2. 2 výpočet směrodatné odchyly: s x = s x výpočet variačního oeficientu: v x = s x [1] [2] pro výpočet aritmeticého průměru využijeme hodnot z Tabuly č. 3 = 75200 pro výpočet rozptylu použijeme údaje z následující tabuly: = 525,87-4-

s 2 x = 43900000 525,87 2 = 30453,75 výpočet směrodatné odchyly: s x = 30453,75 =174,51 výpočet variačního oeficientu v x = 174,51 = 0,3319 525,87 2.3.2 Výpočet metodou transformace středu tříd (znaů) Zavedeme si pomocnou proměnnou z i, pro níž platí: a h Pa číslo hranice tříd Střed třídy x Absolutní i četnost x i2 1 <50; 150) 100 8 80000 2 <150; 250) 200 9 360000 3 <250; 350) 300 7 630000 4 <350; 450) 400 13 2080000 5 <450; 550) 500 11 2750000 6 <550; 650) 600 75 27000000 7 <650; 750) 700 12 5880000 8 <750; 850) 800 8 5120000 Suma 43900000 Tabula 4: Pomocná tabula pro výpočet rozptylu střed třídy s největší četností šířa třídy. z i = x i a h [3], de vážený aritmeticý průměr pomocné proměnné spočítáme: z= 1 z. n=1 aritmeticý průměr je: = z h a. rozptyl pomocné proměnné: s z 2 = 1 n i =1 x i 2 z 2. rozptyl: s x 2 =s z 2 h 2. směrodatnou odchylu a variační oeficient vypočteme ze vztahů [1] a [2]. Zjistíme hodnoty z i dosazením do vztahu [3]. Střed třídy s největší četností je dle Tabuly č. 1 a=600, šířa třídy h=100. -5-

číslo hranice tříd Střed třídy x Absolutní i četnost z i z i z i2 1 <50; 150) 100 8-5 -40 200 2 <150; 250) 200 9-4 -36 144 3 <250; 350) 300 7-3 -21 63 4 <350; 450) 400 13-2 -26 52 5 <450; 550) 500 11-1 -11 11 6 <550; 650) 600 75 0 0 0 7 <650; 750) 700 12 1 12 12 8 <750; 850) 800 8 2 16 32 Suma -106 514 Tabula 5: Pomocná tabula pro výpočet charateristi metodou transformace vážený aritmeticý průměr pomocné proměnné je z= 106 = 0,7413 aritmeticý průměr: = 0,7413 100 600 = 525,87 rozptyl pomocné proměnné: s z 2 = 514 0,7413 2 = 3,0449 rozptyl: s 2 x =3,0449 100 2 = 30448,7990 směrodatná odchyla s x = 30448,7990 = 174,4959 variační oeficient v x = 174,4959 = 0,3318 525,87 2.4 Výpočet průměrné absolutní a relativní odchyly od mediánu průměrná absolutní odchyla od mediánu d aritmeticý průměr absolutních hodnot odchyle hodnot znau od mediánu ve vážené formě: d = 1 x. i =1 průměrnou relativní odchylu od mediánu d ' zísáme vydělením průměrné absolutní odchyly od mediánu aritmeticým průměrem: d d ' =. Pro výpočet průměrné absolutní odchyly od mediánu využijeme výsledů z následující tabuly: číslo hranice tříd Střed třídy x Absolutní i četnost x i x 0,50 1 <50; 150) 100 8 3850,640 2 <150; 250) 200 9 3431,970 3 <250; 350) 300 7 1969,310 4 <350; 450) 400 13 2357,290 5 <450; 550) 500 11 894,630 6 <550; 650) 600 75 1400,250 7 <650; 750) 700 12 1424,040 8 <750; 850) 800 8 1749,360 Suma 17077,490 Tabula 6: Pomocná tabula pro výpočet průměrné absolutní odchyly od mediánu d = 17077,490 = 119,423. -6-

Průměrná relativní odchyla od mediánu: d ' = 119,423 525,87 = 0,2271 2.5 Výpočet momentových charateristi šimosti a špičatosti Momentový oeficient šimosti 3 třetí normovaný moment: 3 = 1 u 3, de i=1 = x i s x Pro doonale souměrná data nabývá momentový oeficient šimosti hodnoty nula. Kladná hodnota signalizuje levostranou (ladnou) asymetrii, zatímco jeho záporná hodnota svědčí o pravostranné (záporné) asymetrii. Momentový oeficient špičatosti 4 čtvrtý normovaný moment zmenšený o tři: 4 = 1 u 4 3, de = x i i=1 s x Je-li hodnota momentového oeficientu špičatosti rovna nula, hovoříme o normální špičatosti, je-li menší než nula, jde o podnormální špičatost, v opačném případě o nadnormální špičatost. Pro výpočet obou oeficientů využijeme tuto tabulu: číslo hranice tříd Střed třídy x Absolutní i četnost 3 3 4 4 1 <50; 150) 100 8-2,4406-14,5370-116,2962 35,4787 283,8293 2 <150; 250) 200 9-1,8675-6,5129-58,6165 12,1629 109,4660 3 <250; 350) 300 7-1,2944-2,1688-15,1816 2,8073 19,6513 4 <350; 450) 400 13-0,7213-0,3753-4,8793 0,2707 3,5196 5 <450; 550) 500 11-0,1483-0,0033-0,0358 0,0005 0,0053 6 <550; 650) 600 75 0,4248 0,0767 5,7503 0,0326 2,4428 7 <650; 750) 700 12 0,9979 0,9937 11,9247 0,9916 11,8997 8 <750; 850) 800 8 1,5710 3,8772 31,0173 6,0910 48,7276 Suma -146,32 479,54 Tabula 7: Tabula pro výpočet šimosti a špičatosti Šimost: 3 = 146,32 = 1,0232 Výslede uazuje, že se jedná o pravostrannou asymetrii. Špičatost: 4 = 479,54 3 =0,3544 Výslede uazuje, že se jedná o nadnormální špičatost. 2.6 Graficé znázornění průměru modu a mediánu Viz příloha: Histogram četnosti prodaných počítačových sestav -7-

3 Souhrn jednotlivých výsledů 600,39s x 0,25 381,77s x 0,50 581,33s x 0,75 628,99s 525,87s mediál cca 597 s 2 s x 30453,75 s s x 174,51s v x 0,3319 33,19 3 1,0232 4 0,3544 119,423s d ' d 0,2271 22,71 4 Přílohy 100,00% 90,00% 80,00% Koncentrační řiva prodaných počítačových sestav 850 750 650 Realtiv ní umulativ ní četnost 70,00% 60,00% 50,00% 40,00% 30,00% 20,00% 10,00% 0,00% 0,00% 10,00% 20,00% 30,00% 40,00% 50,00% 60,00% 70,00% 80,00% 90,00% 100,00% Relativ ní umulativ ní úhrn <- mediál <- medián 550 450 350 250 150-8-

80 Histogram četnosti prodaných počítačových sestav 70 60 Počet dealerů 50 40 30 20 modus 10 0 průměr <50; 150) <150; 250) <250; 350) <350; 450) <450; 550) <550; 650) <650; 750) <750; 850) Počet prodaných usů medián -9-