MATEMATICKÁ STATISTIKA - a základě výběrových dat uuzujeme a obecější kutečot, týkající e základího ouboru; provádíme zevšeobecňující (duktví) úudek - duktví uuzováí pomocí matematcko-tattckých metod je tzv. tattcká dukce - duktví uvažováí ebou vždy ee rzko eprávého úudku (= rzko omylu) - výběrová data muí být pořízea áhodým výběrem. Stattcké dukce zahruje:. teor odhadu. tetováí tattckých hypotéz. Teore odhadu - metody, kterým lze z apozorovaých hodot NV zíkat co ejlepší odhady ezámých parametrů jejího rozděleí.. Bodový odhad - počívá v ahrazeí ezámé hodoty parametru základího ouboru (dále ZS) hodotou vhodé výběrové charaktertky, která bude loužt jako dobrá áhrada ezámého parametru - vhodot jedotlvých odhadů pouzujeme podle ěkolka vlatotí. Vlatot bodového odhadu:. evychýleou (etraot): odhad má vzhledem ke tředí hodotě ulové vychýleí. koztece 3. vydatot. Symbolka: parametry v ZS začíme obecě (kokrétě apř.,, ) výběrové charaktertky začíme obecě t (apř.,, ) t je výběrová chyba ymbolcký záp bodového odhadu: et t ebo t ~.. Itervalový odhad - počívá v kotrukc áhodého tervalu, od ěhož e zvoleou pravděpodobotí očekáváme, že bude obahovat kutečou hodotu ezámého parametru - dovoluje, abychom uvažoval pravděpodobot, íž lze očekávat, že odhad je právý. Spolehlvot odhadu - je to pravděpodobot; - volíme vždy čílo blízké, ejčatěj,95 (evet.,99 ebo,9) - čím vyšší polehlvot žádáme, tím je za jak tejých podmíek IS šrší.
Rzko odhadu - udává, v kolka případech ze (v jakém % případů) ebude IS pokrývat odhadovaý parametr. Itervaly polehlvot mohou být kotruováy jako:. oboutraé: d h, kde h je horí mez,. jedotraé: pravotraé h levotraé > d d je dolí mez Odhad parametru µ (tředí hodoty) ormálího rozděleí. Bodový odhad Bodovým odhadem tředí hodoty evychýleý odhad tředí hodoty. N je výběrový průměr N. Je to Směrodatá odchylka výběrového průměru = tadardí chyba odhadu: - je odrazem přeot výběrového průměru, jako odhadu tředí hodoty - ouví eje varabltou zkoumaého (apříklad bologckého) proceu, ale rověž velkotí výběrového ouboru. D. Itervalový odhad ř kotrukc IS pro parametr μ rozlšujeme 3 případy:. Velký výběr z ormálího rozděleí e zámým rozptylem σ : Oboutraý IS: u u ravotraý IS: u Levotraý IS: u u je příputá chyba odhadu.
3. Velký výběr z ormálího rozděleí ezámým rozptylem σ : ř řešeí praktckých úloh obvykle ezáme rozptyl ZS σ. Odhadujeme jej pomocí výběrového rozptylu :. Oboutraý IS: u u ravotraý IS: u Levotraý IS: u 3. Malý výběr z ormálího rozděleí ezámým rozptylem σ : Kvatly rozděleí N[μ; σ ] ahradíme kvatly Studetova rozděleí t tup volot. Oboutraý IS: t t ravotraý IS: t Levotraý IS: t říklad: Setrojte 95% IS pro tředí hodotu ytolckého tlaku tudetů vyokých škol. Bylo prošetřeo áhodě vybraých tudetů, jejchž průměrý ytolcký tlak čl 3,4 mm g (rtuťového loupce)e měrodatou odchylkou 4 mm g. rovedeme odhad tředí hodoty ormálího rozděleí. Vybereme možot. Velký výběr z ormálího rozděleí ezámým rozptylem σ, oboutraý terval.
u u 4 4 3,4 u,5 3,4 u, 975,95 4 4 3,4 u,5 3,4 u, 975,95 u,96 ; u, 96,5,975,656 6,44, 95 Se polehlvotí 95 % bude hodota ytolckého tlaku tudetů vyokých škol ležet v tervalu,656 mm g až 6,44 mm g. Odhad parametru π (relatví četot )alteratvího rozděleí Je třeba mít k dpozc výběr dotatečě velkého rozahu; to je zajštěo plěím podmíky >9.. Bodový odhad Bodovým odhadem relatví četot m p, M je výběrová relatví četot (výběrový podíl) N M počet jedotek e ledovaou vlatotí v ZS N celkový počet jedotek ZS m počet jedotek e ledovaou vlatotí ve výběrovém ouboru rozah výběru.. Itervalový odhad Oboutraý IS: p p p u p p p u p p u je příputá chyba odhadu. ravotraý IS: p p p u 4
5 Levotraý IS: p p u p Odhad parametru σ (rozptylu) ormálího rozděleí. Bodový odhad Bodovým odhadem rozptylu N N je výběrový rozptyl. Je to ezkreleý a koztetí odhad.. Itervalový odhad ř kotrukc IS pro parametr σ rozlšujeme případy: buď záme parametr μ ebo ho ezáme. V pra je čatější případ, kdy parametr μ ezáme, proto e a ěj zaměříme. Oboutraý IS: ravotraý IS: Levotraý IS: Staoveí mmálího rozahu výběru ro taoveí mmálího rozahu výběru vycházíme ze vzorce příputé chyby odhadu parametru, jehož jedoduchou úpravou dotaeme: u. okud ezáme, použjeme jeho bodový odhad.
Budeme-l vycházet ze vzorce příputé chyby odhadu parametru, dotaeme: u. okud ezáme, použjeme jeho bodový odhad p. 6
Tetováí tattckých hypotéz - tetováí hypotéz je potup, loužící k ověřeí předpokladů o ZS (tzv. hypotéz) a základě výběrových dat (tj. hodot z výběrového ouboru) - hypotéza = určtý předpoklad (tvrzeí) o základím ouboru - tetováí umožňuje rozhodout, zda určtou hypotézu zamíteme č kol, a to malým, předem zvoleým rzkem (α) - pokud e hypotéza týká ezámého parametru pravděpodobotího rozděleí základího ouboru, jde o tety parametrcké - jetlže e hypotéza týká vlatotí základího ouboru, jde o tety eparamtrcké. Základí pojmy a ymbolka: ypotézy: : ulová (tetovaá) hypotéza : alteratví hypotéza Tetové krterum (t): - je to áhodá velča, která má př platot zámé pravděpodobotí rozděleí - protor hodot tetového krtéra rozdělíme a dva djuktí obory (W a V). Krtcký obor (W): - krtcký obor je tvoře hodotam TK, které jou př platot tak etrémí, že pravděpodobot jejch výkytu je velm malá. Obor přjetí (V): - obor přjetí je tvoře všem hodotam TK, které leží mmo krtcký obor. lada výzamot (α) = pravděpodobot chyby I. druhu: - pravděpodobot že zamíteme, ačkol platí. ravděpodobot chyby II. druhu (β): - pravděpodobot, že ezamíteme, ačkol eplatí. Síla tetu (- β): - pravděpodobot právého zamítutí (chopot tetu zamítout eplatou ). Formulace hypotéz: říklad : Na hladě výzamot 5 % tetujte hypotézu, že průměrý ytolcký tlak mužů ad 7 let je tejý jako průměrý ytolcký tlak celé mužké populace. : průměrý ytolcký tlak mužů ad 7 let je tejý jako průměrý ytolcký tlak celé mužké populace : o (eplatí ). 7
říklad : Na hladě výzamot 5 % ověřte hypotézu, že průměrý ytolcký tlak mužů ad 7 let je vyšší ež průměrý ytolcký tlak celé mužké populace. : průměrý ytolcký tlak mužů ad 7 let je tejý jako průměrý ytolcký tlak celé mužké populace : průměrý ytolcký tlak mužů ad 7 let je vyšší ež průměrý ytolcký tlak celé mužké populace. říklad 3: Na hladě výzamot 5 % ověřte hypotézu, že průměrý ytolcký tlak mužů ad 7 let je žší ež průměrý ytolcký tlak celé mužké populace. : průměrý ytolcký tlak mužů ad 7 let je tejý jako průměrý ytolcký tlak celé mužké populace : průměrý ytolcký tlak mužů ad 7 let je žší ež průměrý ytolcký tlak celé mužké populace. Stadardí tetovací potup: - obecý, bez ohledu a kokrétí typ tetu - provádí e v ěkolka krocích.. Formulace hypotéz a.. Volba tetového krtéra: zvolíme vhodou charaktertku, jejíž pravděpodobotí rozděleí př platot je zámé. 3. Vymezeí krtckého oboru: je omeze kvatly rozděleí TK př platot (tzv. krtcké hodoty). 4. Výpočet hodoty TK z výběrových dat. 5. Formulace závěru o výledku tetu: velm důležté, etují pouze dvě možot. I. TK leží v krtckém oboru (TK W): zamítáme, tedy prokázal jme. II. TK eleží v krtckém oboru (TK W): ezamítáme, tedy eprokázal jme. Možé výledky rozhodovacího proceu př tetováí tattckých hypotéz a jejch pravděpodobot Rozhodutí ezamítáme zamítáme platí právé rozhodutí ezamítáme platou eprávé rozhodutí zamítáme platou chyba I. druhu Skutečot eplatí eprávé rozhodutí ezamítáme eplatou chyba II. druhu právé rozhodutí zamítáme eplatou 8
arametrcké tety - hypotézy těchto tetů e týkají ezámých parametrů pravděpodobotího rozděleí základího ouboru - vyžadují mmálě zalot pravděpodobotího rozděleí základího ouboru, což předtavuje velm lý předpoklad - ejčatější je předpoklad ormalty dat, který v pra čato eí plě ebo ho elze ověřt z důvodu malého rozahu výběru - jou obecě áročější ež tety eparametrcké, avšak jejch íla je vyšší - v případě eplěí předpokladů pro parametrcké tety ebo emožot jejch ověřeí je vždy třeba využít tetů eparametrckých (vz další výklad). Tet parametru μ ormálího rozděleí. Formulace hypotéz : a ) oboutraá alteratví hypotéza : : b ) pravotraá alteratví hypotéza : c ) levotraá alteratví hypotéza. Volba tetového krtéra Rozlšujeme tř případy: a) záme rozptyl ZS σ U N; b) ezáme rozptyl ZS σ ; výběr má malý rozah t t c) ezáme rozptyl ZS σ ; výběr má velký rozah N; U 9
3. Staoveí krtckého oboru ro případy a) a c) a růzé typy alteratvích hypotéz: a ) W u; u u a u u b ) W u; u u c) W u; u u ro případ b) a růzé typy alteratvích hypotéz: a) W t; t t ) W t; t t t b c a t t ) W ; t t říklad: Doporučeá hodota průměrého eergetckého příjmu že ve věku 3 let je 7 75 kj. růměrý eergetcký příjem kupy jedeáct áhodě vybraých že ve věku 3 let čí 6 753,6 kj př měrodaté odchylce 4, kj. Na 5% hladě výzamot tetujte hypotézu, že průměrý eergetcký příjem že ve ledovaém věkové tervalu odpovídá doporučeé populačí hodotě. ředpokládáme ormaltu rozděleí ledovaé velčy v základím ouboru. Vzhledem k předpokladu ormalty použjeme parametrcký tet pro tředí hodotu ormálího rozděleí. rotože jde o výběr malého rozahu, použjeme tetové krtérum e Studetovým rozděleím. : 775 : 775 t 6753,6 775,8 4, W t ; t,8 a t,8 Tetové krtérum leží v krtckém oboru, a 5% hladě výzamot tedy zamítáme hypotézu a přjímáme hypotézu. růměrý eergetcký příjem zkoumaé kupy že je a 5% hladě výzamot odlšý od doporučeé hodoty.
Tet parametru σ ormálího rozděleí. : : : : a ) b ) c ). Rozlšujeme dva případy: buď druhý parametr μ záme ebo e. V pra je čatější případ, kdy parametr μ ezáme, proto e a ěj omezíme. b) W ; 3. a) W ; a c) W ; Tet parametru π alteratvího rozděleí Je třeba mít k dpozc výběr dotatečě velkého rozahu, což je zajštěo plěím >9. podmíky. : a ) : b ) : c ) :. U p N; 3. a ) W u; u u a u u b ) W u; u u c) W u; u u
Tetováí hody parametrů ve dvou ouborech Nejdříve je třeba rozlšt, zda e jedá o závlé ebo ezávlé výběry, áledě zvolíme vhodý typ tetu. Nezávlé výběry: - vybíráí jedotek z jedoho základího ouboru ezáví a vybíráí jedotek ze ouboru druhého. Závlé výběry: - hodoty z prvího výběru tvoří logcký pár hodotam z druhého výběru, jedá e o tzv. párové tety - apříklad: výledky vyšetřeí u pacetů před a po aplkac určtého léku. Tet hody tředích hodot dvou ormálích rozděleí (ezávlé výběry). : a ) : b ) : c ) : Další potup, tj. body. a 3. vz tabulka A. Tet hody rozptylů dvou ormálích rozděleí (ezávlé výběry). : : : : a ) b ) c ). F F ( ; ) 3. a) W F; F F ( ; ) a F F ( ; W F; F F ( ; ) b) c) W F; F F ( ; ) )
Tet hody relatvích četotí dvou alteratvích rozděleí (ezávlé výběry) ředpoklad: Máme áhodý výběr velkého rozahu A a áhodý výběr velkého rozahu z rozděleí A, přčemž výběry jou ezávlé.. : a ) : b ) : c ) : z rozděleí. U p p N; p p p p p 3. a ) W U ; U u a U u b ) W U; U u c) W U ; U u Tet hody tředích hodot dvou ormálích rozděleí (závlé výběry) Z každého -tého párově ukutečěého pokuu zjtíme rozdíly jejch průměr d a rozptyl d. d a taovíme. : a ) : b ) : c ) :. t d d t ( ) ) W t; t t 3. a) W t; t t a t t t b c ) W ; t t 3
Tabulka A: Tet hody tředích hodot dvou ormálích rozděleí (ezávlé výběry) Záme Východko a Nezáme a ředpokládáme: Nezáme a ředpokládáme: Tzv. Apové- Welchova korekce t Tetové krtérum U t Rozděleí T př platot N arametry rozděleí t t Alteratví hypotéza : : > : < : : > : < : : > : < U u Krtcký obor U u U u a t t a t t U u t t t t t t a t t t t t t 4
Neparametrcké tety - hypotézy těchto tetů e týkají růzých vlatotí základího ouboru - jou ezávlé č téměř ezávlé a kokrétím pravděpodobotím rozděleí - vyžadují tedy labší předpoklady, ež tety parametrcké (apř. míto ormalty rozděleí vyžadují pouze jeho ymetr atd.) - oprot tetům parametrckým je íla těchto tetů meší. Wlcooův tet pro jede výběr - eparametrcká alteratva tetu o tředí hodotě ormálího rozděleí - evyžaduje plěí předpokladu ormalty dat - amíto tředí hodoty tetujeme populačí medá. ředpoklady tetu: - jedým předpokladem tohoto tetu je ymetre rozděleí NV v základím ouboru. otup tetu: taovíme rozdíly d ~ pokud je ěkterý rozdíl rove ule, je vypuště a rozah výběru e íží abolutí hodoty rozdílů d upořádáme podle velkot a přřadíme jm pořadová číla pořadová číla rozdělíme do dvou kup: S oučet pořadových číel kladých odchylek S oučet pořadových číel záporých odchylek.. Formulace hypotéz ~ ~ : X X ~ ~ a) : X X oboutraá alteratví hypotéza ~ ~ b) : X X pravotraá alteratví hypotéza ~ ~ c) : X X levotraá alteratví hypotéza. Tetové krtérum W TK m S, 3. Staoveí krtckého oboru S W W TK ; W TK w Krtcké hodoty tohoto tetu jou tabelováy pro růzá a. 5
říklad: Doporučeá hodota průměrého eergetckého příjmu že ve věku 3 let je 7 75 kj. růměrý eergetcký příjem kupy jedeáct áhodě vybraých že ve věku 3 let čí 6 753,6 kj př měrodaté odchylce 4, kj. Na 5% hladě výzamot tetujte hypotézu, že průměrý eergetcký příjem že ve ledovaém věkové tervalu odpovídá doporučeé populačí hodotě. ředpoklad ormalty plě eí, proto je třeba použít eparametrcký tet. ~ : X ~ : X 775 775 S 8 ; S 58 W TK, m S S = 8 W W W TK ; TK w, 5 W W ;,7 TK W TK Tetové krtérum leží v krtckém oboru, takže a 5% hladě výzamot zamítáme a prokazujeme. růměrý eergetcký příjem zkoumaé kupy že je tedy a 5% hladě výzamot tattcky výzamě lší od doporučeé hodoty. Maův-Whteyův (Wlcooův) tet pro dva ezávlé výběry - eparametrcká alteratva k tetu hody dvou tředích hodot ormálího rozděleí v případě, že výběry jou ezávlé - používá e v případě porušeí předpokladu ormalty zkoumaé NV - louží ověřeí hody tředích hodot (medáů) ve dvou základích ouborech - je to jede z ejlějších eparametrckých tetů. ředpoklady tetu: - pracujeme ezávlým áhodým výběry o rozahu a - áhodé výběry pocházejí ze pojtého rozděleí - pokud e rozděleí ledovaé velčy v obou populacích lší, pak jedě úroví - škála měřeí NV X je alepoň ordálí. otup tetu: oba oubory pojíme dohromady, hodoty upořádáme vzetupě a podle velkot je očílujeme pořadovým číly hodým hodotám přřadíme průměr jejch pořadových číel R je oučet pořadových číel v prvím výběru R je oučet pořadových číel v druhém výběru 6
vypočteme T a T : T R T R. Formulace hypotéz ~ ~ : X X ~ ~ a) : X X oboutraá alteratví hypotéza ~ ~ b) : X X pravotraá alteratví hypotéza ~ ~ c) : X X levotraá alteratví hypotéza. Tetové krtérum U m T, T 3. Staoveí krtckého oboru W U; U u M,, Krtcké hodoty tohoto tetu jou tabelováy pro růzá a a. říklad: Máme k dpozc údaje o délce reme u dvou kup pacetů, a to edogeí a eurotckou depreí. V obou případech je rozah výběru pacetů, výběry jou ezávlé. Údaje byly pořízey áhodým výběrem, elze však předpokládat, že délka reme má ormálí rozděleí. Na 5% hladě výzamot chceme rozhodout, zda u ledovaých populací pacetů etuje rozdíl ve tředí délce reme. ředpoklad ormalty plě eí, proto je třeba použít eparametrcký tet. ~ ~ : X X ~ ~ : X X Edogeí depree: R 4 Neurotcká depree: R 59 T R 8 T R =63 7
U m 8; 63 = 63 W U U, ; u M ;, 5 W U ; U 37 Tetové krtérum eleží v krtckém oboru, takže a 5% hladě výzamot elze zamítout a prokázat. Nepodařlo e tedy prokázat tvrzeí, že mez tředí délkou reme pacetů edogeí a eurotckou depreí etuje tattcky výzamý rozdíl. χ - tet dobré hody - louží k ověřeí hody mez teoretckým a emprckým rozděleím - předpokladem tetu je možot roztřídt výledky áhodého výběru do určtého počtu (k) djuktích tříd podle ějakého zaku - je použtelý je v případě velkých výběrů - emáme-l k dpozc dotatečě velký výběr, lze míto tohoto tetu aplkovat tet Kolmogorovův-Smrovův. ředpoklady tetu: - je uté, aby rozah výběru zajtl dotatečé teoretcké obazeí ve všech kupách, do chž je oubor roztřídě, tj. 5, - tuto podmíku lze formulovat mírěj: ve všech třídách muí platt a alepoň v 8 % tříd muí platt 5.,, Nejou-l výše uvedeé podmíky plěy, je třeba loučt ěkteré třídy (apř. ouedí č věcě příbuzé). okud e tuace ezlepší, je uto použít jý tet. Teto tet e používá ve dvou tuacích:. udává proporce četotí v jedotlvých kupách (může být formulováo apříklad tutvě).. předpokládá, že ZS má rozděleí určtého typu: pokud udává typ rozděleí jeho parametry, jedá e o úplě pecfkovaý model pokud udává pouze typ rozděleí bez pecfkace parametrů, jde o eúplě pecfkovaý model. Stuace. :, pro =,,..., k : o 8
. G k,, k kde... emprcká (pozorovaá, výběrová) četot,... teoretcké (hypotetcká) četot, tj. teoretcké obazeí -té třídy. 3. W G; G k Stuace Úplě pecfkovaý model (příklad). : o : o Další potup (tj. body. a 3.) vz tuace. Neúplě pecfkovaý model (příklad). : o. : o G k,, k p kde p je počet parametrů rozděleí, které odhadujeme. 3. W G; G k p Závěr tetu: okud TK Є W, zamítáme (tz., že přjímáme ). V tom případě eí rozděleí, pecfkovaé ulovou hypotézou, vhodým modelem pro emprcká data. Shoda obou rozděleí (teoretckého a emprckého) e a hladě výzamot α epotvrdla. Kolmogorovův-Smrovův tet pro jede výběr - tet o tvaru rozděleí, louží k ověřeí hody mez teoretckým a emprckým rozděleím - lze ho použít pro výběr malého č velm malého rozahu - údaje emuí být roztříděy do kup, tet vychází z původích apozorovaých hodot - edochází tak ke ztrátě formace, která je ve výběru obažea. ředpoklady tetu: - áhodý výběr pochází z ěkterého pojtého rozděleí, které muí být hypotézou úplě pecfkovaé. 9
Symbolka: F emprcká (kutečá) dtrbučí fukce áhodé velčy X F teoretcká (hypotetcká) dtrbučí fukce áhodé velčy X Emprcká dtrbučí fukce F : Tuto fukc určíme z hodot upořádaých podle velkot F je defováa tvarem: F, < =,,,,, =,. Tetovací potup:. F F : : o. d up F F 3. W d d d ; ; Krtcké hodoty tohoto tetu jou tabelováy pro růzá a.. Závěr tetu: okud TK Є W, zamítáme a přjímáme. V tom případě eí rozděleí, pecfkovaé ulovou hypotézou, vhodým modelem pro emprcká data. Shoda obou rozděleí (teoretckého a emprckého) e a hladě výzamot α epotvrdla.