PRAVDĚPODOBNOST A STATISTIKA

Podobné dokumenty
Přednáška č. 2 náhodné veličiny

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

SP2 Korelační analýza. Korelační analýza. Libor Žák

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Statistická rozdělení

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

PRAVDĚPODOBNOST A STATISTIKA

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

Doc. Ing. Dagmar Blatná, CSc.

3. Charakteristiky a parametry náhodných veličin

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

Intervalové odhady parametrů některých rozdělení.

8. Zákony velkých čísel

Odhady parametrů 1. Odhady parametrů

8. cvičení 4ST201-řešení

a další charakteristikou je četnost výběrového souboru n.

8. cvičení 4ST201. Obsah: Neparametrické testy. Chí-kvadrát test dobréshody Kontingenční tabulky Analýza rozptylu (ANOVA) Neparametrické testy

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Metody zkoumání závislosti numerických proměnných

PRAVDĚPODOBNOST A STATISTIKA. Testy hypotéz

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

NEPARAMETRICKÉ METODY

14. B o d o v é o d h a d y p a r a m e t r ů

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

Pravděpodobnostní model doby setrvání ministra školství ve funkci

Generování dvojrozměrných rozdělení pomocí copulí

Lineární regrese ( ) 2

Testování statistických hypotéz

12. N á h o d n ý v ý b ě r

2 IDENTIFIKACE H-MATICE POPISUJÍCÍ VEDENÍ Z NAMĚŘENÝCH HODNOT

3. Charakteristiky a parametry náhodných veličin

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

Náhodný výběr 1. Náhodný výběr

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Intervalové odhady parametrů

S1P Popisná statistika. Popisná statistika. Libor Žák

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

8. Analýza rozptylu.

Pro orientaci v této problematice jsme se seznámili s nkolika novými pojmy:

Pravděpodobnost a aplikovaná statistika

Téma 1: Pravděpodobnost

Pravděpodobnost a aplikovaná statistika

Závislost slovních znaků

Digitální učební materiál

Úvod do korelační a regresní analýzy

4. B o d o v é o d h a d y p a r a m e t r ů

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

2. Vícekriteriální a cílové programování

( NV, )} Řešením Schrödingerovy rovnice pro N částic

11. Popisná statistika

12. Neparametrické hypotézy

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

2. TEORIE PRAVDĚPODOBNOSTI

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Pravděpodobnost a aplikovaná statistika

, jsou naměřené a vypočtené hodnoty závisle

9. Měření závislostí ve statistice Pevná a volná závislost

3. část: Teorie hromadné obsluhy. Ing. Michal Dorda, Ph.D.

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Úvod do teorie měření

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

5. Lineární diferenciální rovnice n-tého řádu

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

Optimalizace portfolia

9 Kombinatorika, teorie pravděpodobnosti a matematická statistika

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY Katedra statistiky a pravděpodobnosti STATISTIKA. VZORCE PRO 4ST201 a 4ST210

8. Odhady parametrů rozdělení pravděpodobnosti

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

7 LIMITNÍ VĚTY. Čas ke studiu kapitoly: 70 minut. Cíl:

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

Národní informační středisko pro podporu kvality

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc.

Přednáška V. Úvod do teorie odhadu. Pojmy a principy teorie odhadu Nestranné odhady Metoda maximální věrohodnosti Průměr vs.

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

SP NV Normalita-vlastnosti

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

8 DALŠÍ SPOJITÁ ROZDĚLENÍ PRAVDĚPODOBNOSTI

LABORATORNÍ CVIČENÍ Z FYZIKY. Měření objemu tuhých těles přímou metodou

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

Mendelova univerzita v Brně Statistika projekt

Základy teorie pravděpodobnosti a teorie grafů

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY Katedra statistiky a pravděpodobnosti STATISTIKA. VZORCE PRO 4ST201 a 4ST210

Transkript:

SP esty dobré shody PRAVDĚPODOBNOS A SAISIKA Lbor Žá

SP esty dobré shody Lbor Žá Přpomeutí - estováí hypotéz o rozděleí Ch-vadrát test Chí-vadrát testem terý e založe a tříděém statstcém souboru.

SP esty dobré shody Lbor Žá Přpomeutí - estováí hypotéz o rozděleí Ch-vadrát test Nechť že e áhodá proměá terá má dstrbučí fuc F(x ϑ). Provedeme pousů ( měřeí). Výsledy těchto pousů sou popsáy áhodým výběrem ( ) a eho realzací x ( x x ). Nezámý parametr ϑ zísáme pomocí bodového odhadu. Statstcý soubor převedeme a tříděý statstcý soubor. Předpoládeme že sme dostal m tříd a příslušé četost f. Nechť -tá třída e: estovací rtérum: x ( x x ) x x fˆ pa teoretcá četost se spočítá: ( F( x t m ) F( x doplě rtcého oboru: de e vatl Pearsoova rozděleí s =m - q- stup volost. W ( f 0 fˆ fˆ ) ))

SP esty dobré shody Lbor Žá esty dobré shody - prcp esty dobré shody vycházeí z porováí teoretcé pravděpodobost a odhaduté pravděpodobost pomocí relatví četostí u áhodé velčy terá může abývat oečého počtu možostí. Vychází se z Multomcého rozděleí teré defue pravděpodobost př výběru (s opaováím) z oečého počtu možostí.

SP esty dobré shody Lbor Žá esty dobré shody - prcp Multomcé rozděleí Mu(p p ) Náhodý vetor ~ Mu( p p ) Nechť x x Pa pravděpodobost ( ) N má multomcé rozděleí p ( p p ) (0) e pevě zvoleá -tce pro terou platí: P x x! p( x) p( x x x x ) p p x! x! x! p x e defovaá tvarem: p x

SP esty dobré shody Lbor Žá esty dobré shody - prcp Multomcé rozděleí Mu(p p ) Charatersty: E( ) p D ) p ( p ) ( C( středí hodota: varačí matce: Platí: h var( ) ) p p E ) ( ) E( ) ( p p var( ) dag ( p) pp var( ) dag p p

SP esty dobré shody Lbor Žá Přpomeutí pomů áhodý vetor ( ( ) ) E( ) μ μ var( ) Σ Náhodý výběr: ( ) ( ) ) z E( ) μ Výběrový součet: ( ) ( ) cov( ) var( ) Σ Σ ( 0 ) ( E( ) μ var( ) Σ Nechť sou ezávslé se steým rozděleím. Pa podle as cetrálí lmtí věty platí: ~. NE( ) var( ) Př ozačeí V var() dostáváme: E( ) V E( ) ~ ( h( V ))

SP esty dobré shody Lbor Žá esty dobré shody - Multomcé rozděleí Platí: Nechť ( ) ~ Mu( p p ) pa pro áhodý vetor Y platí: Y ~ N ( 0 Q) de Q I u u u Pro áhodou: ( de Y p p Y Y ) Y ~ ( ) p p p p

SP esty dobré shody Lbor Žá esty dobré shody př zámých parametrech Předpolady: ( ) áhodá proměá e popsáa pomocí pravděpodobost p p p p sou přede zvoleá čísla pro teré platí: Nechť a 0 0 p (0) ( ) eho realzace. x x p 0 0 abývá hodot 0 a p 0 e áhodý výběr ( x) ( x x x ) eho realzace. e výběrový součet a můžeme považovat za aměřeé četost můžeme považovat za aměřeé četost ( ) ( ) ( x x x )

SP esty dobré shody Lbor Žá esty dobré shody př zámých parametrech Platí: p p 0 0 as. ~ ( ) Hypotéza: H testovací rtérum : p p0 p p0 vzhledem x p 0 x p 0 p 0 H A : p p 0 doplě rtcého oboru: W 0 ( podmía: p 5 0 ebo (Yaroldovo rterum př 3: p 0 5q tříd s x 5. ) de q e podíl

SP esty dobré shody Lbor Žá esty dobré shody př zámých parametrech Přílad: Hod ostou celem ste hodly 38x ostou a čísla až 6 Vám padly s ásleduícím četostm: - 9x - 6x 3-7x 4-7x 5-5x 6-34x Na hladě výzamost 005 otestute hypotézu že osta e deálí. Přílad: Volebí straa YZ s udělal průzum své voltelost. Z 00 dotázaých by daou strau vollo 307 04 e erozhodutých a zbyte by strau evoll. Na hladě výzamost 00 otestute hypotézu že stau volí 30% erozhodutých e 0% a evolí strau 50%.

SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Předpolady: ( ) ~ Mu( p( θ) p ( θ)) ) m m ) θ ( θ θ m ) R edegerovaý uzavřeý omezeý terval 3) p ( θ) p ( ) sou fuce proměé θ a platí: p ( θ) θ 4) c 0; p ( θ) c p (θ) p ( θ) 5) dervace a exstuí a sou spoté l q p p ( θ) 6) matce má hodost m. l l m

SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Parametr θ θ dostaeme m rovc : hledáme ao mmum fuce: p p θ θ p ( θ) 0 l m p ( θ) Řešeí θ ~ azýváme odhad metodou modfovaého mma. l Platí: Nechť ) ~ Mu( p ( θ ) p ( )) ( 0 θ0 θ 0 θ ) ( 0 θ m 0 e vtřím bodem. Nechť platí předpolady ) 6). Pa soustava modfovaého mma má právě ede oře θ ~ a teto oře e ozstetí odhad θ 0.a platí: ~ ~ p ( ) as. θ ( θ ) ~ ~ ( m ) p ( θ )

SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Hypotéza: H - áhodý výběr - tříděý statstcý soubor : ~ F( x θ) vzhledem - odhad parametrů ~ ) Pa p θ ~ p ( θ ) x p ( θ ~ ) testovací rtérum ~ p ( θ ) doplě rtcého oboru: W : emá F( x θ) podmía: p ( θ ~ ) 5 (Yaroldovo rterum elze použít platí pouze pro zámé parametry) H A ( as. ~ ( x p 0 ( m ) m ) ( θ ~ )

SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Pozáma: - ečastě se test používá ao test pro ověřeí typu rozděleí (testy o rozděleí) a ao test ezávslost u otgečích tabulách. esty o rozděleí : - poud se edá o dsrétí rozděleí s oečým záladím souborem volí se třídy ta aby v aždé třídě byla eda hodota ze záladího souboru. Pa hodota pravděpodobostí fuce odpovídá hledaým pravděpodobostem p p popřípadě p ( θ) p ( ) θ - poud se edá o spoté rozděleí volba tříd by měla porývat celou oblast dy e hustota větší ež 0. řídy by měly být taové aby měl zhruba steou 5 teoretcou četost. Pro 80 by počet tříd měl být přblžě 5. 00

SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Pozáma: esty o rozděleí : - v případě ezámých parametrů u NP s dstr. fucí F dostáváme: ( f ˆ fˆ ( θ)) f ( θ) ( F( x θ) F( x θ)) t( θ) fˆ ( θ) pa hledáme mmum θ ~ a zšťueme zda ~ t( θ ) W 0 ( m ) ~ Mmum θ ~ a hodota t(θ ) závsí a volbě tříd. teto postup e áročý a výpočet eboť hledáí mma θ ~ e řešeí eleárích rovc - často s využtím umercých (teračích) metod. Často se tedy mmu epočítá a ezámé parametry se odhadou pomocí bodového odhadu. Pa ž postupueme ao testech dobré shody pro zámé ~ parametry. Pa ale platí: t t(θ ) tedy můžeme zamítou platou hypotézu.

SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Přílad - est dobré shody z Expoecálího rozděleí. Měme hypotézu: H : Y ~ Exp (0 ) vzhledem : Y emá Exp (0 ). e Hustota: f ( y ) 0 y H A x 0 dstrbučí fuce: a e F( y ) 0 y y 0 a Nechť Y Y Y e áhodý výběr.z Exp( 0 ) e uspořádáme do 3 tříd: Pa p ) p p J J F( ) 0 ( P Y J hh J ( ) 0 h h J F( h) F(( ) ) ( ) P Y h J F(( ) ) ( ) P Y h

SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Přílad - est dobré shody z Expoecálího rozděleí. Nechť e počet hodot z áhodého výběru Y Y Y teré padou do - té třídy: J Parametr λ dostaeme řešeím rovce: ~ h Výslede: l h de h. řídy se volí taaby h / a /. Doplě rtcého oboru : W 0 ( ) p ( ) 0 p ( ) ~ Pro velé (v lmtím případě) lze použít: ~ x p ( ) estovaá statsta: ~ de x e realzace. p ( )

SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Přílad - est dobré shody z Expoecálího rozděleí. Expoecálí rozděleí popsue čas mez áhodě se vysytuícím událostm. Budeme uvažovat rozděleí ve tvaru: Y ~ Exp (0 ) de f ( y ) F( y ) e 0 y e 0 y x 0 a y 0 a Měme 0aměřeých hodot: 790 660 3 670 4 400 5 3060 6 700 7 500 8 4090 9 30 0 440 350 3770 3 30 4 340 5 350 6 50 7 80 8 650 9 670 0 77 Otestuemehypotézu: H : Y ~ Exp (0 ) : Y emá Exp (0 ) H A

SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Přílad - est dobré shody z Expoecálího rozděleí. E počet tříd = 9 dela třídy h= 7 Pa dostaeme: třída x- x+ střed třídy četost -x relat. čet. umul. čet. 000 700 35 6 03 6 700 400 05 4 0 0 3 400 00 75 3 05 3 4 00 800 45 0 5 5 800 3500 35 005 6 6 3500 400 385 0 8 7 400 4900 455 005 9 8 4900 5600 55 0 0 9 9 5600 665300 595 005 0 počet stupňů volost:7 rtcá hodota pro α=005:4067404 vzhledem malému počtu ebudeme brát ohled a podmíu: p 5 0

SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Přílad - est dobré shody z Expoecálího rozděleí. Poud za λ použeme odhad: dostaeme λ=005069 χ = 74786395 a p-hodotu:09747039. Poud za λ použeme odhad: dostaeme λ= 004464857 χ = 84584449 a p-hodotu:096787766. ~ h Poud za λ použeme odhad: l h dostaeme λ=0047003345 χ = 73897 a p-hodotu:097869887. Poud za λ použeme odhad: dostaeme x ( ) h λ=00590053 χ = 8576445 a p-hodotu:0967306. ~ y

SP esty dobré shody Lbor Žá esty dobré shody př ezámých parametrech Přílad: Měme tříděý stat. soubor: třída x- x+ četost -446-3989 -3989-358 0 3-358 -3047 4 4-3047 -576 6 5-576 -05 7 6-05 -634 7-634 -63 0 8-63 -069 3 9-069 -0 5 0-0 05 Otestute a hladě výzamost 005 že se edá o realzac výběru z ormálího rozděleí.

Lbor Žá est Chí-vadrát (Pearsoův test) o rozděleí se používá u otgečích tabule př testech ezávslost. - edá se o sdružeou hypotézu prot alteratví - testovací rtérum: -doplě rtcého oboru: =(r-)(s-) stupě volost - požadave: 0 W p p p H : A p p p H : SP esty dobré shody 5 esty dobré shody Kategorálí aalýza r s r s..

SP esty dobré shody Lbor Žá Kategorálí aalýza čtyřpolí tabula Jestlže r= a c= a de o tzv. čtyřpolí tabulu pro alteratví (dchotomcé) statstcé zay a Y (apř. pro odpověd respodetů ao aebo e ) Pa Pearsoův test ezávslost a Y má testovací rtérum: W 0 - doplě rtcého oboru: = stupě volost.

SP esty dobré shody Lbor Žá esty dobré shody Kategorálí aalýza Přílad: Měme otgečí tabulu: Otestute a hladě výzamost 005 že hodoceí serálu ezávsí a vzděláí.

SP esty dobré shody Lbor Žá esty dobré shody Kategorálí aalýza Přílad: Spočítáme postupě: Vzděláí Ohodoceí serálu výborý velm dobrý dobrý špatý Suma ZŠ 9 5 4 4 3 SŠ 6 4 5 36 VŠ 5 7 0 3 35 Suma 0 33 8 03 Dostaeme: Vzděláí Ohodoceí serálu výborý velm dobrý dobrý špatý Suma ZŠ 6359 0543 869909 683495 3 SŠ 69909 53398 9786408 76893 36 VŠ 67967 359 954563 747578 35 Suma 0 33 8 03

SP esty dobré shody Lbor Žá esty dobré shody Kategorálí aalýza Přílad: Dále: Vzděláí Ohodoceí serálu výborý velm dobrý dobrý špatý Suma ZŠ 786408 4747573-469903 -83495 0 SŠ -09909-053398 4359-6893 0 VŠ -796-4359 0485437 5547 0 Suma 0 0 78E-5 0 0 Vzděláí Ohodoceí serálu výborý velm dobrý dobrý špatý Suma ZŠ 4953 9845 53835 7586 7655 SŠ 0409 0047 8486 0940583 9978 VŠ 0474688 58389 004767 408 664966 Suma 864509 380646 437768 698665 6469 alfa= 005 rterum 6469 H - zamítá t. volost= 6 rt. hod. 596