SP esty dobré shody PRAVDĚPODOBNOS A SAISIKA Lbor Žá
SP esty dobré shody Lbor Žá Přpomeutí - estováí hypotéz o rozděleí Ch-vadrát test Chí-vadrát testem terý e založe a tříděém statstcém souboru.
SP esty dobré shody Lbor Žá Přpomeutí - estováí hypotéz o rozděleí Ch-vadrát test Nechť že e áhodá proměá terá má dstrbučí fuc F(x ϑ). Provedeme pousů ( měřeí). Výsledy těchto pousů sou popsáy áhodým výběrem ( ) a eho realzací x ( x x ). Nezámý parametr ϑ zísáme pomocí bodového odhadu. Statstcý soubor převedeme a tříděý statstcý soubor. Předpoládeme že sme dostal m tříd a příslušé četost f. Nechť -tá třída e: estovací rtérum: x ( x x ) x x fˆ pa teoretcá četost se spočítá: ( F( x t m ) F( x doplě rtcého oboru: de e vatl Pearsoova rozděleí s =m - q- stup volost. W ( f 0 fˆ fˆ ) ))
SP esty dobré shody Lbor Žá esty dobré shody - prcp esty dobré shody vycházeí z porováí teoretcé pravděpodobost a odhaduté pravděpodobost pomocí relatví četostí u áhodé velčy terá může abývat oečého počtu možostí. Vychází se z Multomcého rozděleí teré defue pravděpodobost př výběru (s opaováím) z oečého počtu možostí.
SP esty dobré shody Lbor Žá esty dobré shody - prcp Multomcé rozděleí Mu(p p ) Náhodý vetor ~ Mu( p p ) Nechť x x Pa pravděpodobost ( ) N má multomcé rozděleí p ( p p ) (0) e pevě zvoleá -tce pro terou platí: P x x! p( x) p( x x x x ) p p x! x! x! p x e defovaá tvarem: p x
SP esty dobré shody Lbor Žá esty dobré shody - prcp Multomcé rozděleí Mu(p p ) Charatersty: E( ) p D ) p ( p ) ( C( středí hodota: varačí matce: Platí: h var( ) ) p p E ) ( ) E( ) ( p p var( ) dag ( p) pp var( ) dag p p
SP esty dobré shody Lbor Žá Přpomeutí pomů áhodý vetor ( ( ) ) E( ) μ μ var( ) Σ Náhodý výběr: ( ) ( ) ) z E( ) μ Výběrový součet: ( ) ( ) cov( ) var( ) Σ Σ ( 0 ) ( E( ) μ var( ) Σ Nechť sou ezávslé se steým rozděleím. Pa podle as cetrálí lmtí věty platí: ~. NE( ) var( ) Př ozačeí V var() dostáváme: E( ) V E( ) ~ ( h( V ))
SP esty dobré shody Lbor Žá esty dobré shody - Multomcé rozděleí Platí: Nechť ( ) ~ Mu( p p ) pa pro áhodý vetor Y platí: Y ~ N ( 0 Q) de Q I u u u Pro áhodou: ( de Y p p Y Y ) Y ~ ( ) p p p p
SP esty dobré shody Lbor Žá esty dobré shody př zámých parametrech Předpolady: ( ) áhodá proměá e popsáa pomocí pravděpodobost p p p p sou přede zvoleá čísla pro teré platí: Nechť a 0 0 p (0) ( ) eho realzace. x x p 0 0 abývá hodot 0 a p 0 e áhodý výběr ( x) ( x x x ) eho realzace. e výběrový součet a můžeme považovat za aměřeé četost můžeme považovat za aměřeé četost ( ) ( ) ( x x x )
SP esty dobré shody Lbor Žá esty dobré shody př zámých parametrech Platí: p p 0 0 as. ~ ( ) Hypotéza: H testovací rtérum : p p0 p p0 vzhledem x p 0 x p 0 p 0 H A : p p 0 doplě rtcého oboru: W 0 ( podmía: p 5 0 ebo (Yaroldovo rterum př 3: p 0 5q tříd s x 5. ) de q e podíl
SP esty dobré shody Lbor Žá esty dobré shody př zámých parametrech Přílad: Hod ostou celem ste hodly 38x ostou a čísla až 6 Vám padly s ásleduícím četostm: - 9x - 6x 3-7x 4-7x 5-5x 6-34x Na hladě výzamost 005 otestute hypotézu že osta e deálí. Přílad: Volebí straa YZ s udělal průzum své voltelost. Z 00 dotázaých by daou strau vollo 307 04 e erozhodutých a zbyte by strau evoll. Na hladě výzamost 00 otestute hypotézu že stau volí 30% erozhodutých e 0% a evolí strau 50%.
SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Předpolady: ( ) ~ Mu( p( θ) p ( θ)) ) m m ) θ ( θ θ m ) R edegerovaý uzavřeý omezeý terval 3) p ( θ) p ( ) sou fuce proměé θ a platí: p ( θ) θ 4) c 0; p ( θ) c p (θ) p ( θ) 5) dervace a exstuí a sou spoté l q p p ( θ) 6) matce má hodost m. l l m
SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Parametr θ θ dostaeme m rovc : hledáme ao mmum fuce: p p θ θ p ( θ) 0 l m p ( θ) Řešeí θ ~ azýváme odhad metodou modfovaého mma. l Platí: Nechť ) ~ Mu( p ( θ ) p ( )) ( 0 θ0 θ 0 θ ) ( 0 θ m 0 e vtřím bodem. Nechť platí předpolady ) 6). Pa soustava modfovaého mma má právě ede oře θ ~ a teto oře e ozstetí odhad θ 0.a platí: ~ ~ p ( ) as. θ ( θ ) ~ ~ ( m ) p ( θ )
SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Hypotéza: H - áhodý výběr - tříděý statstcý soubor : ~ F( x θ) vzhledem - odhad parametrů ~ ) Pa p θ ~ p ( θ ) x p ( θ ~ ) testovací rtérum ~ p ( θ ) doplě rtcého oboru: W : emá F( x θ) podmía: p ( θ ~ ) 5 (Yaroldovo rterum elze použít platí pouze pro zámé parametry) H A ( as. ~ ( x p 0 ( m ) m ) ( θ ~ )
SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Pozáma: - ečastě se test používá ao test pro ověřeí typu rozděleí (testy o rozděleí) a ao test ezávslost u otgečích tabulách. esty o rozděleí : - poud se edá o dsrétí rozděleí s oečým záladím souborem volí se třídy ta aby v aždé třídě byla eda hodota ze záladího souboru. Pa hodota pravděpodobostí fuce odpovídá hledaým pravděpodobostem p p popřípadě p ( θ) p ( ) θ - poud se edá o spoté rozděleí volba tříd by měla porývat celou oblast dy e hustota větší ež 0. řídy by měly být taové aby měl zhruba steou 5 teoretcou četost. Pro 80 by počet tříd měl být přblžě 5. 00
SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Pozáma: esty o rozděleí : - v případě ezámých parametrů u NP s dstr. fucí F dostáváme: ( f ˆ fˆ ( θ)) f ( θ) ( F( x θ) F( x θ)) t( θ) fˆ ( θ) pa hledáme mmum θ ~ a zšťueme zda ~ t( θ ) W 0 ( m ) ~ Mmum θ ~ a hodota t(θ ) závsí a volbě tříd. teto postup e áročý a výpočet eboť hledáí mma θ ~ e řešeí eleárích rovc - často s využtím umercých (teračích) metod. Často se tedy mmu epočítá a ezámé parametry se odhadou pomocí bodového odhadu. Pa ž postupueme ao testech dobré shody pro zámé ~ parametry. Pa ale platí: t t(θ ) tedy můžeme zamítou platou hypotézu.
SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Přílad - est dobré shody z Expoecálího rozděleí. Měme hypotézu: H : Y ~ Exp (0 ) vzhledem : Y emá Exp (0 ). e Hustota: f ( y ) 0 y H A x 0 dstrbučí fuce: a e F( y ) 0 y y 0 a Nechť Y Y Y e áhodý výběr.z Exp( 0 ) e uspořádáme do 3 tříd: Pa p ) p p J J F( ) 0 ( P Y J hh J ( ) 0 h h J F( h) F(( ) ) ( ) P Y h J F(( ) ) ( ) P Y h
SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Přílad - est dobré shody z Expoecálího rozděleí. Nechť e počet hodot z áhodého výběru Y Y Y teré padou do - té třídy: J Parametr λ dostaeme řešeím rovce: ~ h Výslede: l h de h. řídy se volí taaby h / a /. Doplě rtcého oboru : W 0 ( ) p ( ) 0 p ( ) ~ Pro velé (v lmtím případě) lze použít: ~ x p ( ) estovaá statsta: ~ de x e realzace. p ( )
SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Přílad - est dobré shody z Expoecálího rozděleí. Expoecálí rozděleí popsue čas mez áhodě se vysytuícím událostm. Budeme uvažovat rozděleí ve tvaru: Y ~ Exp (0 ) de f ( y ) F( y ) e 0 y e 0 y x 0 a y 0 a Měme 0aměřeých hodot: 790 660 3 670 4 400 5 3060 6 700 7 500 8 4090 9 30 0 440 350 3770 3 30 4 340 5 350 6 50 7 80 8 650 9 670 0 77 Otestuemehypotézu: H : Y ~ Exp (0 ) : Y emá Exp (0 ) H A
SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Přílad - est dobré shody z Expoecálího rozděleí. E počet tříd = 9 dela třídy h= 7 Pa dostaeme: třída x- x+ střed třídy četost -x relat. čet. umul. čet. 000 700 35 6 03 6 700 400 05 4 0 0 3 400 00 75 3 05 3 4 00 800 45 0 5 5 800 3500 35 005 6 6 3500 400 385 0 8 7 400 4900 455 005 9 8 4900 5600 55 0 0 9 9 5600 665300 595 005 0 počet stupňů volost:7 rtcá hodota pro α=005:4067404 vzhledem malému počtu ebudeme brát ohled a podmíu: p 5 0
SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Přílad - est dobré shody z Expoecálího rozděleí. Poud za λ použeme odhad: dostaeme λ=005069 χ = 74786395 a p-hodotu:09747039. Poud za λ použeme odhad: dostaeme λ= 004464857 χ = 84584449 a p-hodotu:096787766. ~ h Poud za λ použeme odhad: l h dostaeme λ=0047003345 χ = 73897 a p-hodotu:097869887. Poud za λ použeme odhad: dostaeme x ( ) h λ=00590053 χ = 8576445 a p-hodotu:0967306. ~ y
SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Přílad: Měme tříděý stat. soubor: třída x- x+ četost -446-3989 -3989-358 0 3-358 -3047 4 4-3047 -576 6 5-576 -05 7 6-05 -634 7-634 -63 0 8-63 -069 3 9-069 -0 5 0-0 05 Otestute a hladě výzamost 005 že se edá o realzac výběru z ormálího rozděleí.
Lbor Žá est Chí-vadrát (Pearsoův test) o rozděleí se používá u otgečích tabule př testech ezávslost. - edá se o sdružeou hypotézu prot alteratví - testovací rtérum: -doplě rtcého oboru: =(r-)(s-) stupě volost - požadave: 0 W p p p H : A p p p H : SP esty dobré shody 5 esty dobré shody Kategorálí aalýza r s r s..
SP esty dobré shody Lbor Žá Kategorálí aalýza čtyřpolí tabula Jestlže r= a c= a de o tzv. čtyřpolí tabulu pro alteratví (dchotomcé) statstcé zay a Y (apř. pro odpověd respodetů ao aebo e ) Pa Pearsoův test ezávslost a Y má testovací rtérum: W 0 - doplě rtcého oboru: = stupě volost.
SP esty dobré shody Lbor Žá esty dobré shody Kategorálí aalýza Přílad: Měme otgečí tabulu: Otestute a hladě výzamost 005 že hodoceí serálu ezávsí a vzděláí.
SP esty dobré shody Lbor Žá esty dobré shody Kategorálí aalýza Přílad: Spočítáme postupě: Vzděláí Ohodoceí serálu výborý velm dobrý dobrý špatý Suma ZŠ 9 5 4 4 3 SŠ 6 4 5 36 VŠ 5 7 0 3 35 Suma 0 33 8 03 Dostaeme: Vzděláí Ohodoceí serálu výborý velm dobrý dobrý špatý Suma ZŠ 6359 0543 869909 683495 3 SŠ 69909 53398 9786408 76893 36 VŠ 67967 359 954563 747578 35 Suma 0 33 8 03
SP esty dobré shody Lbor Žá esty dobré shody Kategorálí aalýza Přílad: Dále: Vzděláí Ohodoceí serálu výborý velm dobrý dobrý špatý Suma ZŠ 786408 4747573-469903 -83495 0 SŠ -09909-053398 4359-6893 0 VŠ -796-4359 0485437 5547 0 Suma 0 0 78E-5 0 0 Vzděláí Ohodoceí serálu výborý velm dobrý dobrý špatý Suma ZŠ 4953 9845 53835 7586 7655 SŠ 0409 0047 8486 0940583 9978 VŠ 0474688 58389 004767 408 664966 Suma 864509 380646 437768 698665 6469 alfa= 005 rterum 6469 H - zamítá t. volost= 6 rt. hod. 596