10 Cvičeí 10 Statistický soubor. Náhodý výběr a výběrové statistiky aritmetický průměr, geometrický průměr, výběrový rozptyl,...). Bodové odhady parametrů. Itervalové odhady parametrů. Jedostraé a oboustraé odhady. Itervalový odhad středí hodoty, rozptylu, relativí četosti. 10.1 Teoretická část 10.1.1 Statistika Statistika je matematická disciplía, která vychází z empirických dat pozorováí), ze kterých pak dělá obecé závěry. Zabývá se řešeím problémů áhodých situací - apř. odhady hodot platé s určitou ppstí, ohodoceí rizik při rozhodováí, aj.. V teorii statistiky je áhodost a eurčitost modelováa pomocí teorie pravděpodobosti. Statistika ám také poskytuje soubor matematických metod postupů) pro pláováí experimetů, získáváí dat a jejich aalýzu a ásledou iterpretaci závěrů. Závěry a rozhodutí učiěé a základě statistických modelů mohou, ale emusí odpovídat realitě. Statistické postupy můžeme rozdělit a: Kofirmačí aalýzu, která se zabývá testováím předem přesě formulovaých hypotéz. Zjedodušeě řečeo, úkolem kofirmačí aalýzy je dávat odpovědi a otázky typu Je pravda, že...? Explorači aalýzu, při které eí dostatečě jasé, co vše může být výsledkem. Jejím cílem je vyčíst z dat maximum iformace, ispirace, poučeí to vše vzhledem k ějakému obecému, často vágě formulovaému problému apř. aalýza příči poruchovosti). Jako statistiku také ozačujeme hodoty, které získáme provedeím áhodého výběru. 10.1. Základí soubor Základí soubor představuje možiu všech prvků s kokrétími sledovaými vlastostmi. které jsou podrobey zkoumáí apř. obyvatelstvo ČR ke di..., výrobky vyrobeé v závodě Z v době od... do... ). Obvykle je teto soubor velmi rozsáhlý - může být koečý i ekoečý. Základí soubor je charakterizová charakteristikami středí hodota, rozptyl, variačí rozpětí,... 10.1.3 Výběrový soubor statistický soubor) Výběrový soubor představuje koečou podmožiu základího souboru - -tice reálých čísel, získaou a základě výsledků statistického experimetu. 1
Uspořádaý statistický soubor - Statistický soubor s uspořádaými prvky podle velikosti. Hodoty v souboru se mohou opakovat. x 1) x )... x ) Popisá statistika - defiuje výběrové charakteristiky statistiky, míry) výběrového souboru charakteristiky míry) polohy charakteristiky míry) variability... 10.1.4 Popisá statistika Charakteristiky polohy Aritmetický průměr Dále platí. x = x 1+x +...+x x i x) = 0. Pro libovolé a x platí: x i x) < x i a) Necht a, b R a položme y i = ax i +b pro i = 1,,...,, pak y = ax+b x je citlivý a hrubé chyby př. 8,00; 1,00; 15,00; 3,00; 1500 x = 311,60). Geometrický průměr x G = x 1.x.....x Geometrický průměr je používá pouze pro kladé hodoty x i. Využívá se zejméa pro určeí průměré hodoty tzv. řetězových idexů. Tj. echt x 0, x 1,..., x udávají počet jedotek apř. prodaých výrobků) v i- tém časovém období. Vývoj počtu jedotek prodeje) charakterizujeme pomocí řetězových idexů i 1 = x 1 x 0, i = x x 1,..., i = Pak lze vyjádřit x = x 0 i 1 i... i. Pak x = x 0 i G ) x x 1. Harmoický průměr x H = x 1 1 +x 1 +x 1 3 +...+x 1
Příklad: Auto jede do kopce rychlostí v 1 a po stejé dráze z kopce rychlostí v. Jaká je jeho průměrá rychlost? Řešeí: Délku tratě ozačme d, dobu jízdy do kopce t 1 = d v 1, dobu jízdy z kopce t = d v, průměrá rychlost je Pro jedotlivé typy průměrů platí: x H x G x Rovost je splěa když jsou všechy prvky x i shodé. d t 1 +t = v 1 1 +v 1 = v H Mediá x představuje prvek, který se ve statistickém uspořádaém souboru achází v poloviě. Představuje robustí míru polohy tz. eí citlivý a hrubé chyby. x = x m) ) pro liché, m = + 1)/ xm) + x m+1) pro sudé, m = / = 1 př. 8,00; 1,00; 15,00; 3,00; 1500 x = 15,00) Modus ˆx je ejčastěji se vyskytující hodota v souboru x 1, x,..., x Modus emusí být urče jedozačě. Charakteristiky variability Rozptyl σ = 1 x i x) σ = σ je směrodatá odchylka Výpočetí tvar rozptylu σ = 1 x i x) Necht a, b R a položme y i = ax i +b pro i = 1,,...,, pak σy = a σx resp. σ y = a σ x. Sa) = 1 x i a) abývá svého miima v bodě a = x. Výběrový rozptyl s = 1 x i x) 1 s = s je výběrová směrodatá odchylka. Výběrový rozptyl má lepší statistické vlastosti ež rozptyl a proto je používaější. s = σ 1 3
Pro velké hodoty řekěme > 100) jsou hodoty rozptylu a výběrového rozptylu skoro stejé. Začeí - ěkdy začíme rozptyl s a výběrový rozptyl s. Variačí rozpětí R = x ) x 1) je vyjádřeo v jedotkách x i. Variačí koeficiet v = R Variačí koeficiet ezávisí a jedotkách x x i. Necht a R a položme y i = ax i pro i = 1,,...,, pak v y = v x. Třídí rozděleí četosti Necht c 1 < c <... < c k 1 jsou daá čísla. Uvažujme itervaly: I 1 = ; c 1 ), I = [c 1, c ),..., I k 1 = [c k, c k 1 ), I k = [c k 1, ), které charakterizují jedotlivé třídy I 1, I,..., I k. 1,,..., k pak začí třídí četosti absolutí třídí četosti) pro ěž platí i i = Relativí třídí četosti 1,,..., k, pro ěž platí i i = 1 z j I j pro j = 1,,..., k je reprezetat třídy, zastupující hodoty třídy. Obvykle se volí uprostřed itervalu. Data rozděleá do třídích četostí zobrazujeme pomocí tyčkového diagramu, polygou ebo histogramem. 10.1.5 Náhodý výběr Náhodý výběr je charakterizová jako posloupost ezávislých stejě rozděleých áhodých veliči X 1, X,..., X, jejichž realizace začíme x 1, x,..., x. Realizace x 1, x,..., x jsou kokrétí reálá čísla a tvoří statistický soubor. Na základě hodot x 1, x,..., x statistického souboru, které jsou realizacemi stejé áhodé veličiy X 1 = X =... = X = X usuzujeme a vlastosti áhodé veličiy X, charakterizující základí soubor. Základí soubor je dále charakterizová distribučí fukcí F X), středí hodotou EX), rozptylem DX),.... Náhodý výběr x 1, x,..., x : je charakterizová empirickou distribučí fukcí, statistikami mírami) - aritmetický průměr, rozptyl, variačí rozpětí,... Pomocí odhadu parametrů budou specifikováy charakteristiky základího souboru. Poz. Stejě jako u statistických souborů se můžeme také setkat s pojmy uspořádaý áhodý výběr, áhodý výběr sdružeý do tříd, atp. 4
10.1.6 Odhady parametrů Na základě hodot statistického souboru hodot realizace áhodého výběru s vykresleým histogramem četostí) určíme, o jaký typ rozděleí pravděpodobosti by mohlo jít. Pro bližší specifikaci parametrů jedotlivých rozděleí jsou používáy bodové a itervalové odhady těchto parametrů. Bodové odhady Charakteristiku základího souboru odhadují a základě kokrétích charakteristik áhodého výběru. Necht x 1, x,..., x jsou realizace áhodého výběru áhodé veličiy X 1 = X =... = X = X, která má distribučí fukci F x; G), kde G je obecě ezámý parametr apříklad p, µ, σ, ρ, λ,...) Bodovým odhadem parametru G azveme libovolou statistiku áhodého výběru, která ezávisí a G. Ozačíme ji g = gx 1, x,..., x ). g = Ĝ. Bodové odhady vybraých charakteristik Necht X je áhodá veličia s koečou středí hodotou a x 1, x,..., x jsou realizace -krát ezávisle opakovaé veličiy X,pak bodovým odhadem středí hodoty je aritmetický průměr EX) = x = 1 x i bodovým odhadem rozptylu pro jdoucí do ekoeča, je veličia rozptyl DX) = σ = 1 x i x) bodovým odhadem rozptylu je veličia výběrový rozptyl s, tedy DX) = s = 1 x 1 i x) Itervalové odhady Charakteristiku základího souboru odhadujeme itervalem a pravděpodobostí, že uvedeá charakteristika bude ležet v daém itervalu. Necht x 1, x,..., x jsou realizace áhodého výběru áhodé veličiy X 1 = X =... = X = X, která má distribučí fukci F x; G), kde G je obecě ezámý parametr. Itervalovým odhadem kofidečím odhadem) parametru G je iterval g d ; g h ), který s daou pravděpodobostí 1 α obsahuje ezámý parametr G. Jedá se o iterval spolehlivosti pro parametr G s koeficietem spolehlivosti 1 α. Itervalové odhady dělíme a dvoustraý itervalový odhad P g d < G < g h ) = 1 α jedostraý levostraý, resp. pravostraý) itervalový odhad P g d < G) = 1 α P G < g h ) = 1 α. 5
g d a g h jsou vhodě určeé statistiky vycházející z realizací x 1, x,..., x a volby α. g d = g d x 1, x,..., x, α) a g h = g h x 1, x,..., x, α). Koeficiet 1 α azýváme koeficiet spolehlivosti odhadu spolehlivost odhadu). Hodotu α hladiu výzamosti) volíme obvykle 1%, 5% ebo 10%. Na zvoleém α závisí přesost odhadu = g h g d )/, která je také závislá a rozsahu výběrového souboru. Itervalové odhady parametru µ ormálího rozděleí pro zámou hodotu σ. Necht x je áhodá veličia s ormálím rozděleím Nµ, σ ) a x 1, x,..., x jsou realizace -krát ezávisle opakovaé veličiy X. Pak: dvoustraý iterval spolehlivosti pro parametr µ x u1 α σ ; x + u 1 α ) σ jedostraé itervaly spolehlivosti pro parametr µ x σ u1 α ; ) ) ; x + σ u1 α Itervalové odhady parametru µ ormálího rozděleí pro ezámou hodotu σ dvoustraý iterval spolehlivosti pro parametr µ x t1 α ν = 1) s ; x + t 1 α ν = 1) ) s jedostraý iterval spolehlivosti pro parametr µ x s t1 α ν = 1) ; ) ) ; x + s t1 α ν = 1) Kde t α ν = 1) je kvatil studetova t-rozděleí a s = 1 x 1 i x) je odhad rozptylu Itervalové odhady parametru σ Necht x je áhodá veličia s ormálím rozděleím Nµ, σ ) a x 1, x,..., x jsou realizace -krát ezávisle opakovaé veličiy X, pak dvoustraý iterval spolehlivosti pro parametr σ ) 1)s ; 1)s χ 1 α ν= 1) χ α ν= 1) jedostraý iterval spolehlivosti pro parametr σ 1)s χ 1 α ν= 1); ) ; 1)s χ α ν= 1) ) 6
10. Příklady 1. Na růzých svorkách byla v časovém itervalu postupě aměřea apětí: a),3,,4,15, V b) 0,,19,,1,0 V Vypočtěte průměré apětí pomocí aritmetického, geometrického a harmoického průměru. Zjištěé hodoty avzájem porovejte. Dále zjistěte modus, mediá, vypočtěte rozptyl, směrodatou odchylku jedotlivých statistických souborů. Určete variačí rozpětí. Řešeí a) x = 8 = 4, 667V, x 6 G = 6 1440 = 3, 36V, x H = 6 =, 79V. Modus=, mediá=,5, rozptyl=1,89, směrodatá odchylka=4,68v. Va-,15 riačí rozpětí=13v. b) x = 104 = 17, 33V, x 6 G = 6 70400 = 13, 84V, x H = 6 = 8, 05V. 1,19 Modus=0, mediá=0, rozptyl=47,89, směrodatá odchylka=6,9v. Variačí rozpětí=0v.. a) mějme realizaci áhodého výběru z rozděleí P oλ): 8, 6, 11, 7, 9, 9, 1, 13. Odhaděte parametr λ b) mějme realizaci áhodého výběru z rozděleí Nµ; σ ): 175, 186, 189, 169, 170, 184. Odhaděte parametry µ a σ c) mějme realizaci áhodého výběru z rozděleí Bi100; p): 3, 3, 3, 3, 6, 0, 0, 1,, 3. Odhaděte parametr p d) mějme realizaci áhodého výběru z rozděleí Expλ): 5,4; 9,4;,4; 1,6; 4,9; 14,1; 34,1; 9,3; 1,4. Odhaděte parametr λ Řešeí a) geerováo P o9, 38) b) geerováo N178; 74, 17) c) geerováo Bi100; 0, 04) d) geerováo Exp0, 09). 3. X je áhodá veličia s ormálím rozděleím Nµ, σ ). Náhodým výběrem byly získáy ásledující hodoty: 175, 186, 189, 169, 170, 184. Dále víme, že σ = 49. Spočtěte dvoustraý itervalový odhad pro parametr µ. Hladia výzamosti 7
α = 0, 05 Řešeí: Itervalový odhad - parametr µ leží s pravděpodobostí 95% v itervalu 173,3; 184,43). 4. X je áhodá veličia s ormálím rozděleím Nµ, σ ). Spočtěte dvoustraý itervalový odhad pro parametr σ a základě áhodého výběru: 175, 186, 189, 169, 170, 184. Hladia výzamosti α = 0, 05. Řešeí: Parametr σ s pravděpodobostí 95% leží v itervalu 8,9; 446,5). Výběrová směrodatá odchylka s = 74, 17. 10.3 Literatura s dalšími příklady Reif, Jiří: Metody matematické statistiky. Straa 8 51. 8