6 Itervalové odhady parametrů základího souboru V předchozích kapitolách jsme se zabývali ejprve základím zpracováím experimetálích dat: grafické zobrazeí dat, výpočty výběrových charakteristik kapitola a kapitola 3 a ásledující kapitoly se zaměřily a teoretické modely populačích souborů kapitola 5 Jedím ze základích problémů, které ám pomáhá statistika řešit, je odhadout charakter populačího souboru apříklad odhadout parametry modelového rozděleí a základě malého počtu pozorováí ějaké veličiy, a základě výběru V předcházející kapitole jsme se podrobě věovali ormálímu rozděleí, které je přirozeým modelem pro řadu reálých situací Výzam ormálího rozděleí je však také v jeho statistických vlastostech - lze ukázat, že pokud budeme opakovaě provádět výběr z populace a pro každý výběr spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z ormálího rozděleí Rozděleí vziklé opakovaým vybíráím vybíráme prvků a výpočtem výběrového aritmetického průměru x se azývá rozděleí výběrového průměru a lze matematicky dokázat, že toto rozděleí má při velmi obecých podmíkách ormálí rozděleí pro rozsah výběru jdoucí do ekoeča Obrázek : Rozděleí výběrového průměru
Na obrázku vidíme vlastosti, které můžeme formulovat ásledujícím způsobem: rozděleí výběrového průměru má stejý průměr stejou středí hodotu jako rozděleí populace Ex = µ; variabilita rozděleí výběrového průměru klesá se zvětšováím rozsahu výběru Ex = σ ; rozděleí průměrů odpovídá ormálímu rozděleí více ež rozděleí populace x N µ; σ Pokud tedy aše aměřeá data mají charakter průměrých hodot, můžeme předpokládat, že odpovídají modelu ormálího rozděleí 6 Itervaly spolehlivosti, koeficiet spolehlivosti, hladia výzamosti Typický způsob statistického uvažováí je ásledující Máme k dispozici aměřeá data, tato data považujeme za výběr áhodý výběr z populace rozsahu a předpokládáme, že populace má charakter ormálího rozděleí Pak podle výše uvedeých vlastostí můžeme za přirozeý odhad populačího průměru µ použít aritmetický průměr ašeho výběrového souboru Takovémuto odhadu říkáme bodový odhad Víme ale, že bodový odhad je ovlivě celou řadou dalších faktorů, ve kterých se projevují odlišosti výběru Proto místo bodových odhadů používáme itervalové odhady, kde alezeme iterval, ve kterém skutečá hodota populačího průměru bude velmi pravděpodobě ležet Jako hraice mezi je velmi epravděpodobé a e tak velmi epravděpodobé se běžě užívá pravděpodobost 5%, tato hraičí hodota se azývá hladia výzamosti a začí se Hodota se azývá koeficiet spolehlivosti a itervaly, které odvodíme pro zvoleé azýváme 00%-í iterval spolehlivosti Určeí itervalu spolehlivosti ám tedy umožňuje tvrdit, že pokud byly splěy všechy předpoklady pak hodota populačího průměru bude ležet uvitř ašeho itervalu v 00% výběrech Formálě zapsáo, když g d je dolí hraice itervalu a g h je horí hraice itervalu, platí Pg d < µ < g h = Jiak řečeo, iterval g d ; g h pokryje hodotu parametru µ s pravděpodobostí, resp provedeme-li z moha růzých áhodých výběrů moho růzých itervalových odhadů parametru µ, pak 00% získaých itervalů spolehlivosti bude pokrývat skutečou hodotu parametru µ Hodota hladiy výzamosti je obvykle volí 5%, ale u velmi rozsáhlých souborů se můžeme setkat též s volbou = % aopak u rozsahově malých souborů se ěkdy spokojíme s volbou = 0% Itervaly tvaru g d ; + resp ; g h azýváme jedostraé dolí, resp horí itervaly spolehlivosti
6 Iterval spolehlivosti pro průměr při zámém rozptylu Předpokládáme, že a základí soubor má ormálí rozděleí se zámou hodotou rozptylu σ předpokládáme, že rozptyl ebo směrodatou odchylku záme z jiého statistického šetřeí a že je tuto hodotu možo použít i ásledě Dvoustraý itervalový odhad středí hodoty µ iterval spolehlivosti pro µ má tvra x u σ ; x + u σ Jedostraý itervalový odhad σ x u ; +, resp σ ; x + u, kde x je aritmetický průměr, u je kvatil ormovaého ormálího rozděleí pro = 5%, je u = u 0975 = 96 a u = u 095 = 64, σ je zámá směrodatá odchylka a je rozsah výběru V Excelu ajdeme hodotu u pomocí fukce NORMSINV, apříklad NORMSINV 095 64 63 Iterval spolehlivosti pro průměr při ezámém rozptylu Předpokládáme, že a základí soubor má ormálí rozděleí s ezámou hodotou rozptylu σ předpokládáme, že rozptyl ebo směrodatou odchylku ezáme a je třeba ji odhadout z dat, která máme k dispozici Dvoustraý itervalový odhad středí hodoty µ iterval spolehlivosti pro µ x t s ; x + t s Jedostraý itervalový odhad s x t ; +, resp s ; x + t, kde x je aritmetický průměr, t je kvatil Studetova t-rozděleí se stupi volosti, s je odhad směrodaté odchylky s = x i x a je rozsah výběru i= 3
V Excelu ajdeme hodotu t pomocí fukce T INV a;, kde a odpovídá hodotě, apříklad t 095 0 spočteme v Excelu vztahem T INV 00; 0 8 a T INV 00; 000000 64 Další možostí je použití fukce CON F IDEN CE; ssměrodatá odchylka;, která ám poskyte s hodotu t 64 Iterval spolehlivosti pro rozptyl Předpokládáme, že a základí soubor má ormálí rozděleí Dvoustraý itervalový odhad rozptylu σ iterval spolehlivosti pro rozptyl σ s ; s χ χ Jedostraý itervalový odhad s χ ; + resp s ; χ kde χ je kvatil χ rozděleí se stupi volosti, s je odhad směrodaté odchylky s = x i x a je rozsah výběru i= V Excelu ajdeme hodotu χ pomocí fukce CHINV a;, kde a odpovídá hodotě, apříklad χ 0050 spočteme v Excelu vztahem CHINV 0975; 0 959 a CHINV 005; 0 347 65 Iterval spolehlivosti pro rozdíl průměrů u dvou ezávislých výběrů se zámým rozptylem Předpokládáme, že máme k dispozici dva áhodé výběry, které jsou ezávislé a pochází ze základích souborů, které mají ormálí rozděleí se stejou, zámou hodotou rozptylu σ Ozačme, rozsahy výběrů a = +, dále x a x jsou aritmetické průměry příslušých výběrů Dvoustraý itervalový odhad rozdílu středích hodot µ µ iterval spolehlivosti pro µ µ 4
x x u σ ; x x + u σ Jedostraý itervalový odhad resp ; x x + u σ ; x x u σ ; + 66 Iterval spolehlivosti pro rozdíl průměrů u dvou ezávislých výběrů s ezámými rozptyly Předpokládáme, že máme k dispozici dva áhodé výběry, které jsou ezávislé a pochází ze základích souborů, které mají ormálí rozděleí, ale o jejich rozptylech emáme žádé další doplňující iformace Ozačme, rozsahy výběrů a = +, dále x a x jsou aritmetické průměry příslušých výběr a s a s jsou odhady rozptylů jedotlivých výběrů s + s Ozačme s p = + Dvoustraý itervalový odhad rozdílu středích hodot µ µ iterval spolehlivosti pro µ µ x x t + s p ; x x + t + s p Jedostraý itervalový odhad resp ; x x + t + s p ; x x t + s p ; + 67 Iterval spolehlivosti pro podíl rozptylů dvou ezávislých výběrů Předpokládáme, že máme k dispozici dva áhodé výběry, které jsou ezávislé a pochází ze základích souborů, které mají ormálí rozděleí, ale o jejich rozptylech emáme žádé další doplňující iformace Dvoustraý itervalový odhad podílu rozptylů σ iterval spolehlivosti pro σ σ σ s s F ; ; s F ; s 5
Jedostraý itervalový odhad ; resp F ; F ; s s s s ; + V Excelu ajdeme hodotu F, pomocí fukce F INV a; ;, kde a odpovídá hodotě, apříklad F 0975 0, 0 spočteme v Excelu vztahem F INV 005; 0; 0 77 a F 005 0, 0 spočteme vztahem F INV 0975; 0; 0 09 68 Iterval spolehlivosti pro relativí četost Předpokládejme, že provedeme áhodý výběr rozsahu a zjišt ujeme, kolik z prvků v ašem áhodém výběru má sledovaou vlastost Je-li jich r, pak relativí četost sledovaé vlastosti ve výběru je p = r relativí četost se také udává v procetech, v takovém případě hovoříme o procetu výskytu sledovaé vlastosti Statistická teorie ám říká, že je-li > 00 a pp eí příliš malé, pak relativí četost výskytu vlastosti v celé populaci má ormálí rozděleí s průměrem rovým pravděpodobosti výskytu vlastosti v celé populaci π a směrodatou odchylkou s = π π Dvoustraý itervalový odhad četosti π v populaci iterval spolehlivosti pro π π π π π p u ; p + u 69 Rozsah výběru a jeho vliv a iterval spolehlivosti Jak jsme již ukázali v má a šířku itervalu spolehlivosti velký vliv zvoleá hodota hladiy výzamosti, druhý výzamý faktor ovlivňující šířku itervalu spolehlivosti je rozsah výběru - čím větší je rozsah výběru, tím je variabilita rozděleí výběrového průměru meší a iterval spolehlivosti je užší Ozačme ɛ = g h g d šířku odhadu itervalového dvoustraého odhadu Tato šířka vyjadřuje přesost odhadu a závisí a parametrech daého itervalového odhadu Pro itervalový odhad průměru při zámém rozptylu je šířka itervalu rova ɛ = u σ Pokud požadujeme, aby šíře itervalového odhadu epřekročila mezí hraici ɛ max, pak lze určit požadovaý rozsah áhodého výběru 6
> u σ ɛ max Aalogicky lze odvodit miimálí požadovaé rozsahy pro ostatí itervalové odhady 7