. STATISTIKA Statistika zkoumá evy a dostatečě ozsáhlém soubou říadů a hledá ty vlastosti evů, kteé se oeví až v soubou říadů a e a edom říadě. Tyickým říkladem e ůmě zámek ve škole z daého ředmětu, ůměá volebí účast ve volbách, ocetuálí zastoueí homoseuálě oietovaých ediců v oulaci,. Statistický soubo, statistické edotky, zak Základím omem e statistický soubo a eho vky, kteé se azývaí statistické edotky. Teto soubo vyšetřueme z hlediska zvoleého zaku (ebo více zaků). Hodota zaku musí být vždy edozačě staovea. Eistuí řitom dva duhy zaků:. kvatitativí zak - eho hodota e učea číselou hodotou (výška ostavy v cm, zámka z matematiky, očet souozeců, říem uvedeý v Kč, );. kvalitativí zak - eho hodoty sou dáy kvalitou (ovoláí daé osoby, bava očí, ohlaví, odiý stav, ), eedodušší kvalitativí zaky sou řitom ty, kteé sou dáy učitým evem a eho oakem (muž - žea, osěl - eosěl, voák - evoák, ); tyto zaky se azývaí alteativí zaky. Příkladem statistického soubou e databáze žáků školy, ve kteé e o každém žákovi uložea řada ifomací - méo, římeí, datum aozeí, místo aozeí, adesa bydliště, číslo ISIC katy, zámky a ololetích vysvědčeích, uvolěí z ředmětů (ař. z TV), Jedotlivými statistickými edotkami sou ak edotliví žáci a eich vlastosti. Zakem, z hlediska kteého statistický soubo vyšetřueme, může být aoze v květu, bydlí v Paze, muž, ůmě zámek a všech vysvědčeích z matematiky e meší ež,5,. Rozděleí četostí a eho gafické zázoěí.. Zavedeí omů a eich vysvětleí Při statistickém šetřeí se zavidla vyšetřue více zaků, kteé ás zaímaí ak každý zvlášť, tak i ve vzáemém vztahu. Při ředvoleím ůzkumu zaímá olitické stay, ak bude kdo volit (ede zak - staa, kteou volím ). Je ale zaímavé také vědět, ak volí lidé z vekova a z větších měst ( staa, kteou volím a bydliště ), ak volí lidé ůzého vzděláí ( staa, kteou volím a evyšší dosažeé vzděláí ) ebo ábožeství ( staa, kteou volím a vyzáí ), Po další výklad se omezíme e a šetřeí, ve kteých ás bude zaímat e ede zak. Výsledkem šetřeí tedy e sezam edotek s udáím hodoty zaku u každé z ich. Jsou-li edotky v sezamu očíslováy,,, ( ), ak im odovídaící hodoty zaku ozačíme symboly,,...,. Často může zak abývat e učitého očtu ůzých hodot; tyto hodoty zaku ozačíme symboly,,...,. Ve statistickém soubou zámek z matematiky a výočím vysvědčeí 30 žáků edé třídy ebude 30 ůzých hodot ( = 30) ale e ět ( = 5) - t. eda z ěti zámek oužívaých ke klasifikaci. Po každou možou hodotu očet se azývá četost hodoty edotek soubou, t. latí: Relativí četost e ak defiováa vztahem a udává, aká část soubou má hodotu zaku zistíme, kolikát se vyskytla mezi zaky,,...,. Takto zištěý. Součet četostí všech možých hodot zaku se ová očtu všech.. Na základě vztahů () a () e zřemé, že latí:. Relativí četost e možé vyadřovat také v ocetech; součet elativích četostí e ak ove 00 %. Rozděleí četostí daého zaku statistického soubou můžeme gaficky zázoit ůzými zůsoby:. tabulkou ozděleí četostí - zavidla dvouřádková (es. dvousloucová) tabulka, v eímž vím řádku (es. slouci) sou uvedey hodoty zaku a ve duhém řádku (es. slouci) e uvedea četost ebo elativí četost (udaá desetiým číslem ebo v ocetech); () () (3)
. soicovým diagamem (olygoem četostí) - soeí bodů, eichž ví souřadice e hodota zaku a duhá souřadice e odovídaící četost; 3. sloukový diagam (histogam) - oužívá se zeméa tehdy, sou-li hodoty zaku sdužey do itevalů; tyto itevaly ak tvoří základy slouků a odovídaící četosti udávaí výšky slouků; Do itevalů lze sdužit ař. tělesou výšku ostavy udaou v cetimetech (vytvoříme itevaly 50-54, 55-59, 60-64, ), očty obyvatel ve městech (0-5000, 500-0000, 000-5000, ) a odobě. 4. kuhový diagam - ůzým hodotám zaku odovídaí kuhové výseče, eichž lošé obsahy (a tedy středové úhly) sou úměé četostem (v tomto gafu se velmi často oužívaí elativí četosti vyádřeé v ocetech). Histogam se oužívá většiou o zázoěí ozděleí četostí kvatitativích zaků a kuhový diagam se oužívá většiou o zázoěí ozděleí četostí kvalitativích zaků... Kokétí ukázka Máme k disozici sezam zámek z matematiky a ololetím vysvědčeí v edé třídě:,,,,,3,,4,3,3,4,5,3,4,5,,,,,,3,4,3,3,3. (4) Po ěkteé statistické chaakteistiky (uvedeé v odstavci.3) e uté řadu zámek (4) seřadit vzestuě. Dostaeme tak řadu,,,,,,,,,,,3,3,3,3,3,3,3,3,4,4,4,4,5,5. (5) Tabulka ozděleí četostí e zobazea a ob.. Na základě í e ak sestoe olygo četostí zobazeý a ob.. Jedotlivé body tohoto gafu odovídaí edotlivým zámkám a eich četostem. ob. ob. ob. 3
4). Na ob. 3 e ak zobaze histogam se steou vyovídací hodotou, akou má olygo četostí. S využitím vztahu () e možé doočítat elativí četosti a zobazit e v kuhovém diagamu (viz ob. ob. 4.3 Chaakteistiky olohy a vaiability Po kvatitativí zaky lze zavést další chaakteistiky, kteé sou udáy samostatými čísly. Úlou statistiku daého zaku odává ozděleí četosti (viz odstavec.), ale i čísla chaakteizuící olohu a vaiabilitu zaku sou o řadu alikací důležitá..3. Zavedeí omů a eich vysvětleí Nečastěi oužívaou chaakteistikou olohy zaku e aitmetický ůmě. A RITMETICKÝ PRŮMĚR ZNAKU JE SOUČET HODNOT ZNAKU ZJIŠTĚNÝCH U VŠECH JEDNOTEK SOUBORU DĚLENÝ POČTEM VŠECH JEDNOTEK SOUBORU: (6). i Počítáme-li aitmetický ůmě z tabulky ozděleí četostí, e uté každou hodotu četostí. Vztah (6) e oto uté uavit do tvau:. i ásobit eí Učováí ůměu má smysl ouze v těch statistických souboech, ve kteých sou idividuálí odchylky edotlivých vků soubou ahodilé. Ve statistických souboech, ve kteých sou idividuálí odchylky edotlivých vků soubou systematické, e vhoděší učovat ůměý říůstek. Dalšími chaakteistikami olohy sou modus a mediá. M ODUS ZNAKU SE ZNAČÍ Mod A UDÁVÁ HODNOTU ZNAKU ČETNOSTÍ. M EDIÁN ZNAKU SE ZNAČÍ (7) S NEJVYŠŠÍ Med A UDÁVÁ PROSTŘEDNÍ HODNOTU ZNAKU, JSOU-LI HODNOTY,,..., USPOŘÁDÁNY VZESTUPNĚ PODLE VELIKOSTI. P ŘITOM PLATÍ: Med JE- LI LICHÉ; Med JE- LI SUDÉ. Mediá se užívá ako chaakteistika olohy zeméa v těch souboech, ve kteých hodoty zaku u ěkteých edotek etémě vybočuí z řady ostatích hodot (viz odstavec.3.). Každá chaakteistika olohy (aitmetický ůmě, modus, mediá) e učea číslem, kolem kteého edotlivé hodoty zaku kolísaí. Míu tohoto kolísáí vyadřuí chaakteistiky vaiability (chaakteistiky omělivosti) zaku. 3
Jako chaakteistika vaiability k aitmetickému ůměu (akožto chaakteistice olohy) se většiou oužívá oztyl. R OZPTYL s ZNAKU JE DEFINOVANÝ JAKO PRŮMĚR DRUHÝCH MOCNIN ODCHYLEK OD ARITMETICKÉHO PRŮMĚRU: s i. i Je-li oztyl očítá a základě tabulky četostí, ak vztah (8) řede a vztah s. Pokud ovedeme ve vztahu (8) azačeé umocěí, získáme ostuě: s i i i i i i i i i i i Aalogickou úavu můžeme ovést i se vztahem (9).. Další chaakteistikou e směodatá odchylka. S MĚRODATNÁ ODCHYLKA s JE DEFINOVANÁ JAKO DRUHÁ ODMOCNINA Z ROZPTYLU: s i. i Směodatá odchylka chaakteizue vaiabilitu zaku ve steých edotkách, v akých byly udáy hodoty zaku, zatímco oztyl e vyádře ve duhé mociě těchto edotek. Poto e o techická měřeí (fyzika, chemie, ) vhoděší oužívat směodatou odchylku aměřeých dat. Bezozměým číslem (vyadřuícím se v ocetech), kteé chaakteizue vaiabilitu zaku, e vaiačí koeficiet. V ARIAČNÍ KOEFICIENT ARITMETICKÉHO PRŮMĚRU: (8) (9) (0) v JE DEFINOVÁN JAKO PODÍL SMĚRODATNÉ ODCHYLKY A s () v 00 %. Z defiice e zřemé, že vaiačí koeficiet má smysl ouze tehdy, okud sou hodoty zaku ezáoé. V říadě, že statistický soubo bude tvoře aměřeými daty (fyzikálími, chemickými, ), ředstavue vaiačí koeficiet elativí chybu (elativí odchylku) daého měřeí. Posledí chaakteistikou vaiability sou kvatily. K VANTIL URČUJE HODNOTU ZNAKU, PRO KTEROU PLATÍ, ŽE NEJMÉNĚ PROCENT PRVKŮ DANÉHO STATISTICKÉHO SOUBORU MÁ HODNOTU MENŠÍ NEBO ROVNOU A 00 PROCENT PRVKŮ SOUBORU MÁ HODNOTU VĚTŠÍ NEBO ROVNOU. V ai se oužívaí tyto kvatily:. 50 e mediá; Defiice uvedeá výše říká, že mediá e ostředí vek vzestuě usořádaého soubou. To ale zameá, že 50 % hodot soubou e meších ebo ových mediáu a zbývaících 50 % hodot e větších ebo ových mediáu.. 5 e dolí kvatil; 3. 75 e hoí kvatil; 4.,, 3,..., 99 sou ecetily. Při ůzých soutěžích, výběových řízeích, řiímacích zkouškách, se oužívaí k oisu úsěšosti daého uchazeče ávě ecetily. Je-li tedy ař. ecetil uchazeče 89 (t. e a 89tém ecetilu), zameá to, že 89 % uchazečů e hoších ež o a ouze % e leších ež o. Pokud e avíc ředem asé, že úsěšých v daém řízeí bude eleších 90 % účastíků, má teto účastík isté, že e mezi úsěšými. Budeme-li acovat se vzestuě usořádaým statistickým souboem, kteý bude mít statistických edotek, e kvatil ove vku stoícímu a k-tém místě v soubou. Přitom k získáme ze vztahu () k 00 4
tak, že výsledek uvedeého odílu zaokouhlíme vždy ahou..3. Kokétí ukázka Vátíme-li se yí ke zámkám z matematiky (4) uvedeých v odstavci.., můžeme doočítat další chaakteistiky tohoto soubou. Půměá zámka (vyočteá odle vztahu (6) e,68. Mediá zámek e 3 - edá se o třiáctou zámku ve vzestuě seřazeém sezamu zámek (5), kteých e celkem 5. Pokud budeme cháat mediá ako kvatil 50, ak můžeme odle vztahu () sočítat ořadí 550 50 zámky, kteá e mediáem: k,5 ; o zaokouhleí ahou dostáváme tedy k 3. Získali 00 00 sme tedy steé ořadí ako s využitím defiice mediáu. Modus zámek e 3, otože toka se vyskytue v sezamu zámek ečastěi (viz též tabulka četostí a ob. ). Roztyl zámek e odle vztahu (8) ove,4. Směodatá odchylka e a základě vztahu (0) ova,9. Vaiačí koeficiet zámek vyočteý odle vztahu () e ove 0,44. Z aktického hlediska e ěkdy vhoděší udávat mediá ež ůmě. V ěkteých říadech má totiž leší vyovídací hodotu. Uvažume teto soubo čísel:,,,, 3, 3, 4, 4, 5, 6, 8, 0, 50, 00, 4. Půmě těchto čísel e 50 a mediá e 4. V říadě soubou čísel 44, 45, 46, 47, 48, 48, 49, 50, 5, 5, 5, 53, 54, 55, 56, kteý má steý očet statistických edotek, e ůmě 50 a mediá také 50. U duhé řady čísel maí ůmě a mediá steou vyovídací hodotu. A to e oto, že sou obě hodoty steé, ale oto, že sou řibližě steé ako edotlivá čísla v tomto soubou (směodatá odchylka e ova 3,56). U ví řady e ale většia čísel výazě meší, ež e ůmě těchto čísel. Poto e mediá leší chaakteistikou tohoto soubou, otože a základě ě lze získat ředstavu o hodotách čísel (víme, že a ostředím místě vzestuě seřazeého soubou čísel e číslo 4, kteé e tyickým číslem soubou, zatímco ůmě e více ež 0kát vyšší; směodatá odchylka e 80,89). I z toho důvodu e ař. úda o ůměé mzdě obyvatel v daé zemi evhodý. Výazě leší by bylo udávat mediá latu obyvatel daé země. 5