Statitická šetřeí a zpracováí dat Statitika e věda o metodách běru, zpracováí a vyhodocováí tatitických údaů. Statitika zkoumá polečeké, přírodí, techické a. evy vždy a dotatečě rozáhlém ouboru údaů. Matematická tatitika vychází ze hromážděých tatitických údaů. Zabývá e eich matematickým zpracováím a rozborem výledků. Statitické údae (data) ou číelé údae o polečekých, přírodích, techických a. kutečotech, o tzv. hromadých evech. Statitický oubor e oubor oob, věcí, událotí, evů apod. hromážděých a základě toho, že maí určité polečé vlatoti. Jedotlivé prvky tatitického ouboru e azývaí tatitické edotky. Počet všech prvků tatitického ouboru ozačueme ako rozah ouboru a začíme. Základí tatitický oubor e oubor všech vybraých edotek. Výběrový tatitický oubor obahue e čát edotek základího ouboru. S výběrovými oubory pracueme zpravidla tehdy, ou-li základí oubory příliš rozáhlé a zkoumáí všech edotek by bylo eproveditelé, příliš pracé, čaově áročé ebo ákladé. Statitické edotky vyšetřueme a základě zvoleého tatitického zaku, který zpravidla začíme. Jedotlivé údae zaku e azývaí hodoty zaku a začíme e,,...,. Statitický zak e buď kvatitativí ebo kvalitativí. Hodoty kvatitativího zaku e liší číelou hodotou, apř. zámka z tetu, výška, váha, hrubý ročí příem, hektarový výo atd. Hodoty kvalitativího zaku e liší kvalitou, která e zpravidla vyádřea lovím popiem. Jou dva druhy kvatitativích zaků, buď zaky alterativí, které ou dáy určitým evem a eho opakem, apř. žea - muž, propěl epropěl, voák evoák, ebo zaky abízeící více možotí hodot, apř. árodot, barva očí, ábožetví, atd.. Rozděleí četotí a grafické zázorěí Předpokládeme, že při tatitickém šetřeí á zaímá ediý tatitický zak, který abývá hodot,,...,, e rozah ouboru. Ve většiě šetřeí e počet růzých hodot zaku k meší, ež počet edotek v ouboru, k. To zameá, že ěkolik růzých edotek téhož ouboru abývá teých hodot. Abolutí četot (četot) hodoty zaku udává počet tatitických edotek, kterým příluší teá hodota zaku. Abolutí četot začíme. Součet četotí všech možých hodot zaku e rová rozahu ouboru: k. Relativí četot hodoty zaku udává podíl abolutí četoti hodoty zaku a rozahu ouboru. Relativí četot začíme v a platí: v. Součet všech relativích četotí e rová edé: k v. Relativí četoti daé hodoty zaku můžeme také udávat v procetech, pak e eich oučet 00%. Všechy růzé hodoty zaku a im odpovídaící četoti (abolutí, relativí, abolutí i relativí) můžeme zapat do tabulky, tzv. tabulka rozděleí četotí, ebo tabulka rozděleí relativích četotí, ebo poeá tabulka rozděleí četotí a relativích četotí:
Tab.. zak k četot k relat. četot v v v vk Př. Ve třídě 3.A e 3 tudetů, z ichž dva tudeti maí z tetu zámku, deet tudetů zámku, dvaáct tudetů zámku 3, šet tudetů zámku 4 a dva tudeti zámku 5. Zpracute tabulku rozděleí četotí a relativích četotí, přičemž ledovaou hodotou zaku e zámka z tetu. Řešeí př. Souborem e 3 tudetů třídy 3.A, 3. Tab.. zámka z tetu 3 4 5 četot 0 6 relat. četot v 3 0 3 3 6 3 3 Pokud e rozah tatitického ouboru velký a potupuí-li hodoty zaku po příliš malých krocích, pak e blízké hodoty zaku družuí do kupi tvořeých itervaly. Needodušší e volit všechy itervaly teé šířky. Hodoty z téhož itervalu pak zaokrouhlueme a třed itervalu. Příklad itervalového rozděleí četotí: Vážíme hmototi všech 30 tudetů třetího ročíku. Z aměřeých hodot zíkáme áleduící tabulku rozděleí četotí: Tab..3 hmotot [kg] 53-57 58-6 63-67 68-7 73-77 78-8 8-87 četot 7 34 4 48 4 6 Rozděleí četotí lze zázorit graficky, tedy provét grafické zázorěí rozděleí četotí. Zpravidla pracueme grafy v pravoúhlé outavě ouřadic, a vodorovou ou vyášíme hodoty zaku ebo itervalu, a a vilou ou vyášíme im odpovídaící četoti ebo relativí četoti. Nečatěi rozděleí četotí zázorňueme polygoem četoti a hitogramem četoti. Polygo četotí (poicový diagram) zíkáme poeím bodů, eichž prví ouřadice e hodota kvatitativího zaku (itervalu) a druhá ouřadice e odpovídaící četot.
četot četot Obr.. (viz. Tab..) Obr..3. (viz. Tab..3) 5 0 5 0 3 4 5 zámka z tetu 60 50 t 40 o30 t e0 č0 0 55 60 65 70 75 80 85 hmotot (kg) Hitogram četotí (loupkový diagram) e používá zpravidla u itervalového rozděleí četotí. Základy loupků leží a vodorové oe a eich šířky odpovídaí šířkám itervalů, výšky loupků odpovídaí eich četotem. Obr..3. (viz. Tab..3) 60 40 0 0 53-57 58-6 63-67 68-7 73-77 78-8 8-87 hmotot (kg) Rozděleí četotí kvalitativího zaku e zázorňue kruhovým diagramem, v ěm růzým hodotám zaku odpovídaí kruhové výeče, eichž plošé obahy ou úměré četotem. Př. 30 tudetů třetího ročíku i volí vého zátupce do tudií rady. Volba dopadla takto: 5% tudetů zvolilo Jau K., 5% tudetů zvolilo Karla J., 60% tudetů zvolilo Lucii B. Zázorěte výledky voleb kruhovým diagramem. Řešeí př. Obr..4 Jaa K. 5% Lucie B. 60% Karel J. 5%. Charakteritiky polohy Statitickými charakteritikami azýváme číla, která podávaí tručou a ouhrou iformaci o ouboru. Pokud e omezíme a podmíku, že vyšetřueme tatitický oubor a základě ediého kvatitativího zaku, edá e o charakteritiky polohy (úrově) a variability (promělivoti). 3
Charakteritiky polohy hodoty zaku (eboli tředí hodoty zaku) ou číla charakterizuící polohu zaku a číelé oe. Za charakteritiku polohy můžeme zvolit aritmetický průměr, modu, mediá, harmoický průměr, geometrický průměr. Každá zištěá hodota zaku e oučtem dvou ložek. Prví ložka e charakteritická pro celý oubor a udává o ěm určitou globálí iformaci. Druhá ložka předtavue idividuálí odchylku kokrétí hodoty a má zpravidla áhodý charakter. Vytvořeím průměru prví ložka vyike, eboť kladé a záporé idividuálí odchylky e v oučtu avzáem ruší. Aritmetický průměr má myl ako charakteritika polohy tehdy, pokud ou odchylky aměřeých hodot ahodilé a v ouboru e evykytuí etrémě ízké ebo vyoké hodoty. Vypočteme ho ako podíl oučtu hodot zaku zištěých u všech edotek ouboru a rozahu... ouboru: i. i Pokud počítáme aritmetický průměr z tabulky rozděleí četotí, pak muíme každou hodotu k... kk áobit eí četotí, tedy použieme vzorec:. Takto vypočítaý aritmetický průměr azýváme vážeý aritmetický průměr, váhy ou daé četotmi,,..., k. Pokud ou hodoty zaku dáy buď velkým čílem větším ež čílo a (pro 0 ) ebo malým čílem meším ež čílo a (pro 0 ), pak lze při výpočtu aritmetického průměru využít tzv. metodu vhodě zvoleého počátku. Hodoty zaku zapíšeme ve tvaru a bu, kde a, b ou kotaty. Pak aritmetický průměr vypočítáme: Př. i i a b u a bu. Průměrý ročí hrubý příem byl ziště u všech 0 zamětaců emeovaého podiku. Výledky šetřeí ou zapáy v áleduící tabulce rozděleí četotí. Tab.. Ročí příem (Kč) 5 000 75 000 76 000 00 000 0 000 5 000 6 000 50 000 5 000 75 000 Četot 4 5 8 Metodou vhodě zvoleého počátku vypočítete průměrý ročí hrubý příem zamětaců v tomto podiku. Řešeí př. Ve výpočtu budeme pracovat e tředy itervalů, tedy hodotami 63000 Kč, 88000 Kč, 3 3000 Kč, 4 38000 Kč, 5 63000 Kč. Zvolme apř. a 63000, pak u 0 Kč, u 5000 Kč, u3 50000 Kč, u4 75000 Kč, u5 00000 Kč. /Idey u a u zameaí pořadí itervalů./ Průměrý ročí hrubý příem vypočítáme: 40 55000 850000 75000 00000 63000 0750 Kč. 0 4
Tam, kde idividuálí odchylky eou ahodilé, ale ytematické, aritmetický průměr ztrácí myl. Průměrý přírůtek (úbytek) y vyšetřovaého zaku za edo čaové období e zaímavou charakteritikou polohy v čaových řadách, kde data vykazuí určitý vývo v čae. Očílume edotlivá období 0,,,,, pak im odpovídaící hodoty zaku ozačme 0,,,..., a přírůtky za edotlivá období y 0, y,, y. Vzorec pro výpočet 0 průměrého přírůtku: y yi. i Geometrický průměr G e ve tatitice využívá k výpočtu průměrého tempa růtu v árodohopodářkých čaových řadách, tedy tempa růtu průmylové ebo zemědělké výroby. Vzorec pro výpočet geometrického průměru:,,..., e zpravidla udávaí v procetech. 0 Př.... G. Hodoty růtu 0 0 V edmi po obě doucích letech ou hodoty růtu výroby elektroiky procetuálě určey: 05,5%, 07,%,,%, 0,6%, 08,3%, 0,%, 09,8%. Vypočítete průměré ročí tempo růtu výroby za toto edmileté období. Řešeí př. Průměré ročí tempo vyádříme geometrickým průměrem 7 05,5 07,, 0,6 08,3 0, 09,8 07,8 %. G Doplňuícími charakteritikami polohy ou modu a mediá. Modu zaku e hodota, která má v ouboru evětší četot. Začí e 5 Mod. Modu použieme ako doplňkovou charakteritiku ouboru tehdy, máme-li etaveou tabulku rozděleí četotí velkým rozahem hodot, ebo má-li pecifický výzam. Mediá zaku e protředí hodota zaku, ou-li hodoty,,..., upořádáy podle velikoti. Začí e Med. Mediá použieme ako doplňkovou charakteritiku ouboru tehdy, když ou v ouboru zatoupey prvky hodotami zaku mimořádě odlišými oproti otatím hodotám. Je-li... Př. 3, pak Med Med, pokud e liché,, pokud e udé. Určete modu a mediá ako doplňkové charakteritiky polohy ouboru, který e popá v př. této kapitoly. Řešeí př. 3 Nevětší četot v tomto ouboru e 3 8, které příluší tředí hodota itervalu 3 3000 Kč. /3 zameá tředí hodotu třetího itervalu./ Proto Mod 3000 Kč.
V ouboru e udý počet edotek a eich hodoty ou upořádáy podle velikoti.. Proto ado zitíme 0 3000 Kč, 3000 Kč, a tedy Med 3000 3000 3000 Kč. /0 zameá hodotu deátého prvku, hodotu edeáctého prvku ouboru, přičemž prvky ou v ouboru eřazey podle vých hodot vzetupě./ Pozor, a základě tohoto příkladu emíme vyvodit, že modu a mediá e obě rovaí. Př. 4 Ve třídě 3 tudety byla zišťováa výše eich kapeého a měíc. Výledky šetřeí ou zpracováy v áleduící tabulce rozděleí četotí. Tab.. Výše kapeého (Kč) Četot tudetů 50 00 00 500 5 3 Určete průměrou hodotu, modu a mediá kapeého ve třídě. Porovete tyto charakteritiky polohy. Řešeí př. 4 550 00 300 500 98 Kč, 50 3 Mod Kč, Med 6 00 Kč. Protože eda hodota zaku v tomto ouboru e výrazě odlišá, e ako doplňková charakteritika polohy vhoděší mediá. To dokládá i porováí aritmetického průměru mediáem, modu e výrazě ižší ež aritmetický průměr a mediá. 3. Charakteritiky variability Charakteritiky variability (kolíáí, promělivoti) hodot zaku ou číla popiuící kolíáí edotlivých hodot zaku okolo zvoleé charakteritiky polohy. V ouboru, ve kterém ako charakteritiku polohy zvolíme aritmetický průměr, e vhodou charakteritikou variability rozptyl a měrodatá odchylka. Průměrá abolutí odchylka (začí e d ) e aritmetický průměr abolutích hodot odchylek i i hodot zaku všech prvků ouboru od aritmetického průměru: d, ebo ve vážeém tvaru k d. Rozptyl zaku (začí e ) e aritmetický průměr druhých moci odchylek hodot zaku od i k. aritmetického průměru: i, ebo ve vážeém tvaru k Jedotka (fyzikálí edotka) rozptylu e druhou mociou edotky hodoty zaku, aritmetického průměru a dalších charakteritik polohy. 6
Směrodatá odchylka (začí e ) e druhá odmocia z rozptylu: i. i Jedotka (fyzikálí edotka) měrodaté odchylky e teá, ako edotka hodoty zaku, aritmetického průměru a dalších charakteritik polohy. Variačí koeficiet v e podíl měrodaté odchylky a aritmetického průměru. Vyadřue e v procetech: v 00%. Má myl e tehdy, abývá-li zak e ezáporých hodot. Př. V příkladu kapitoly e vyšetřová průměrý ročí hrubý příem 0 zamětaců edoho podiku. Vypočítete průměrou abolutí odchylku, rozptyl, měrodatou odchylku a variačí koeficiet průměrého ročího hrubého přímu těchto zamětaců. Řešeí př. Již me vypočetli aritmetický průměr hrubého ročího přímu 0750 Kč. Pro další potřebé výpočty i zpracueme přehledě tabulku: Tab. 3. Středy itervalů ročího přímu (Kč) 63000 88000 3000 38000 63000 38750 3750 50 3650 650 Četot 4 5 8 Průměrou abolutí odchylku vypočteme 438750 53750 850 3650 650 d 375Kč, rozptyl vypočteme 0 438750 53750 850 3650 650 7787500 (Kč), měrodatá 0 6780 odchylka e 7787500 6780 Kč a variačí koeficiet e v 00% 3,3%. 0750 V ouboru, ve kterém e vhodou charakteritikou polohy mediá, e vhodou charakteritikou variability mezikvartilová odchylka. Mezikvartilová odchylka zaku (začí e..., pak: prví kvartil Q e hodota čtvrtiová : Q zaokrouhleé a ebližší vyšší celé čílo, Q 3. Je-li Q ) e vypočítá: Q Q Q 4 4, etliže e dělitelé čtyřmi,, etliže eí dělitelé čtyřmi, e čílo 4 7
třetí kvartil Q 3 e hodota tříčtvrtiová : Q3 3 3 zaokrouhleé a ebližší vyšší celé čílo. Q 3 3 4 4, etliže e dělitelé čtyřmi,, etliže eí dělitelé čtyřmi, 3 e čílo 3 4 Variačí rozpětí R e rozdíl mezi evětší a emeší hodotou zaku prvků v ouboru: R. Je pouze orietačí charakteritikou variability. ma mi Př. V příkladu 4 kapitoly e zišťováa výše kapeého 3 tudetů téže třídy. Jako evhoděší charakteritiku polohy me v tomto příkladu zvolili mediá. Určete ako charakteritiku variability mezikvartilovou odchylku. Řešeí př. V ouboru e 3 edotek, 3 eí dělitelé čtyřmi, proto 8, 3 4, Kč a mezikvartilová odchylka Q 00 50 5 Q3 00 3 Kč. Q 50 Kč, 4. Statitická závilot zaků Pokud pro tatitické šetřeí ouboru zvolíme dva zaky, y a hodoty zaků,., a y,,y a obě avzáem závií, pak ou zaky, y tatiticky závilé, tedy ou ve vzáemé korelaci. (Needá e o edozačou závilot, a rozdíl od fukčí záviloti.) Zázorěme hodoty,.,a zaku a hodoty y,,y zaku y do outavy ouřadic Oy. Pokud takto zázorěé body (upořádaé dvoice i; y i leží v blízkoti přímky, kterou těmito body proložíme, pak můžeme závilot zaků, y vyádřit pomocí koeficietu korelace r k defiovaého: r, kde k i yi y y y a, y ou měrodaté odchylky zaků, y. y i Pro koeficiet korelace r platí r. Čím víc e blíží k k, tím větší e závilot mezi zaky, y. Př. V tabulce ou uvedey výledky měřeí velikoti bot a výšky 0 tudetů edé třídy a dále šetřea závilot velikoti bot a výšce tudeta. Ověřte přibližou lieárí závilot zaků b (velikot bot) a y (výška tudeta) a vypočítete koeficiet korelace. Tab. 4. iiciály tudeta J.K. K.L. O.P. P.S. I.V. L.M. M.O. L.P. S.T. K.O. velikot bot (zak b) výška tudeta (cm) 36 37 37 38 38 40 4 44 44 45 50 49 58 60 65 70 75 78 80 85 8
výška (cm) (zak v) bv 5400 553 5846 6080 670 6800 7350 783 790 83 5 Zázorěí lieárí záviloti velikoti bot a výšky tudeta: velikot boty Výpočty: b 40,, v 67cm, bv 6733,6, k 6733,6 40,67 36,9, b 0,9 3,, b v 43,4 v 36,9 r 0,96 3, Protože e koeficiet korelace čílo blízké edé, ou zvoleé zaky ve vzáemé korelaci. 9